





计算 机 -4 科 扩 学 及 局 习 站 
IE 一 SH 第 2 反 


人 
程序 妈 寺 奸 化 
Python 计 算 与 应 用 开发 实践 


| 关 | 户 博 米尔 。 佩 尔 科 维 奇 ( Ljubomir Perkovic ) 省 
RA 


长 瑞 1 上 HI 
有 可 

一 上 

一 

ED 


地 
湾 
J 
“~ 


Introduction to Computing Using Python 


An Application Development Focus Second Edition 


Computing 


python 


AN APPLICATION DEVELOPMENT FOCUS 


Ljubomir Perkovic 


mWILEY 


区 i 蚀 < 
一 





机 械 工 业 出 版 社 


@iellale Vlelolallal sdlSKN 











原 书 第 2 版 o> ee 


程序 议 计 守 论 
Python 计 算 与 应 用 开发 实践 


[ 美 ] 卢 博 米 尔 :， 佩 尔 科 维 奇 (Ljubomir Perkovic) 和 洁 
江 红 余 青 松 主 








Introduction to Computing Using Python 
An Application Development 上 ocus Second Edition 


Bn 











机 械 工 业 出 版 社 


China Machine Press 


图 书 在 版 编目 (CIP ) 数据 


程序 设计 导论 : Python 计算 与 应 用 开发 实践 ( 原 书 第 2 版 ) / ( 美 ) 卢 博 米尔 : 佩 尔 科 维 奇 

(Ljubomir Perkovic) 著 ; 江 红 ， 余 青松 译 . 一 北京 : 机 械 工业 出 版 社 ，2018.10 

(计算 机 科学 丛书 ) 

书 名 原文 : Introduction to Computing Using Python : An Application Development 
Focus, Second Edition 


ISBN 978-7-111-61160-8 
I 程 … 了 .人 @ 卢 -… ”图 江 … 人 @ 余 … IIL 软件 工具 - 程序 设计 IV. TP311.561 
中 国 版 本 图 书馆 CIP 数据 核 字 ( 2018 ) 第 235232 号 


本 书 版 权 登 记号 : 图 字 01-2018-4065 


Copyright © 2015 John Wiley & Sons, Inc. All rights reserved. 

All rights reserved. This translation published under license. Authorized translation 
from the English language edition, entitled Introduction to Computing Using Python: An 
Application Development Focus, Second Edition, ISBN 978-1-118-89094-3, by Lijubomir 
Perkovic, Published by John Wiley & Sons. No part of this book may be reproduced in any 
form without the written permission of the original copyrights holder. 

本 书 中 文 简体 字 版 由 约翰 * 威 立 父子 公司 授权 机 械 工 业 出 版 社 独家 出 版 。 未 经 出 版 者 书面 许可 ， 不 
得 以 任何 方式 复制 或 抄袭 本 书 内 容 。 

本 书 封 奔 贴 有 Wiley 防伪 标签 ， 无 标签 者 不 得 销售 。 


本 书 不 仅仅 是 传统 的 程序 设计 导论 性 教材 ， 而 且 襄 插 了 包罗 万 象 的 计算 机 科学 知识 。 书 中 采用 
Python 作为 学 生 的 第 一 门 程序 设计 语言 ， 提 出 “正确 的 时 刻 + 正确 的 工具 ”的 教学 方法 ， 尤 为 重视 应 
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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 目 然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 和 名 
家 辈出 、 独 领 风 怠 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 花 密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作， 不仅 局 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 让， 我 国 的 计算 机 产业 发 展 迅 独 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 我 们 
就 将 工作 重点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson、 
McGraw-Hill、Elsevier、MIT、John Wiley 多 Sons 、Cengage 等 世界 著名 出 版 公司 建立 了 民 
好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum 、Bjarne Stroustrup、 
Brian W. Kernighan、 Dennis Ritchie、Jimn Gray、Afred V. Aho、 John E. Hopcroft、 Jetfrey 
D. Ullman 、Abraham Silberschatz、 William Stallings 、Donald E. Knuth、 John L. Hennessy、 
Larry L. Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 从 书 ” 为 总 称 出 版 ， 供 读者 
学 习 、 人 研究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 和 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提 供 了 
中 肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 
500 个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书 
籍 。 其 影印 版 “经 典 原 版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐渐 
深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 入 一 个 新 的 阶段 ,我们 的 目标 是 尽 善 尽 
美 ， 而 反馈 的 意见 正 蚌 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公 司 欢 迎 老 师 和 读者 对 我 们 
的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com 
电子 邮件 : hzjsj@hzbook.com 
联系 电话 : (010 ) 88379604 
联系 地 址 ， 北 京 市 西城 区 百 万 庄 南 街 1 号 i 
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本 书 是 一 本 基于 Python 应 用 程序 开发 实践 的 计算 机 程序 设计 导论 课 的 教程 ， 不仅 可 以 
作为 程序 设计 的 人 门 教程 ， 更 提供 了 计算 机 科学 概念 和 现代 计算 机 应 用 程序 开发 工具 的 广泛 
知识 和 应 用 。 

本 书 采 用 面向 问题 的 叙述 方式 ， 即 在 适当 的 时 刻 引 入 相关 的 计算 概念 、 算 法 技术 、 
Python 结构 和 其 他 工具 ， 而 不 是 逐一 罗列 计算 的 概念 和 Python 语言 结构 知识 。 本 书 提供 了 
大 量 基 于 Python 交互 式 命令 行 的 示例 ,或 励 学 生动 手 实践 。 书 中 还 包含 大 量 的 练习 题 、 习 
题 和 思考 题 ， 可 以 进一步 巩固 和 拓展 读者 学 到 的 知识 。 本 书 还 包括 额外 的 11 个 案例 研究 
(可 访问 华章 网 站 www.hzbook.com 下 载 )， 综 合 展示 对 应 草 市 中 所 涉及 的 概念 和 工具 ， 可 以 
引导 读者 提高 解决 实际 问题 的 能 

本 书 以 “广度 优先 ”的 方式 组 织 内 容 ， 共 分 为 四 个 部 分 : 计算 机 科学 导论 和 Python 基 
础 (第 1 一 3 章 )、 基 于 了 Python 的 算法 设计 和 问题 解决 (第 4 一 6 半 )、 基 于 Python 的 复杂 
应 用 程序 开发 (第 7 ~ 9 章 )、 知 识 深入 和 高 级 应 用 (第 10 一 12 章 )。 本 书 由 浅 入 次 ,理论 
知识 和 实际 应 用 相 结合 ， 逐 步 引 导读 者 学 会 使 用 计算 机 程序 设计 解决 各 种 问题 。 

本 书 的 另 一 大 特色 是 讲解 细致 ， 正 文中 使 用 了 大 量 的 图 和 表 等 ， 使 谈 者 更 容易 阅读 
和 理解 正文 内 容 。 对 于 程序 设计 过 程 中 可 能 出 现 的 法 在 陷阱 ， 本 书 以 “注音 事项 ”的 形 
式 给 出 启示 。 书 中 还 采用 “知识 拓展 ”的 形式 来 简 要 地 探索 有 趣 但 稍微 偏离 正文 内 容 的 

本 书 是 DePaul ( 德 保罗 ) 大 学 的 精品 课 教 程 ， 在 其 提供 的 教学 官网 ( www.wiley.com/ 
college/perkovic) 中 包含 大 量 的 教学 辅助 内 容 ， 无 论 是 教师 、 助 教 、 学 生 ， 还 是 一 般 读者 ， 
均 可 以 从 本 书 教学 官网 中 获取 与 本 书 内 容 相关 的 额外 信息 的 资源 库 。 

本 书 几 华东 师范 大 学 江 红 和 余 青 松 共同 翻译 。 衷 心 感谢 机 械 工 业 出 版 社 华章 公司 的 编辑 
曲 烟 积极 帮 我 们 筹划 翻译 事宜 并 认真 审阅 翻译 稿件 。 在 本 书 翻 详 的 过 程 中 我 们 力求 忠于 原 
著 ,， 但 由 于 时 间 和 学 识 所 限 ， 且 本 书 涉及 各 个 领域 的 专业 知识 ,不 足 之 处 在 所 难免 ， 冤 请 诸 
位 同行 、 专 家 和 读者 指正 。 


江 红 余 青 松 


2018 年 8 月 
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本 教程 介绍 程序 设计 、 计 算 机 应 用 程序 开发 和 计算 科学 的 基础 知识 及 应 用 实践 ， 适 用 于 
大 学 水 平 的 程序 设计 导论 课程 。 本 教程 不 仅仅 是 程序 设计 的 入 门 教程 ， 更 提供 了 计算 机 科学 
概念 和 现代 计算 机 应 用 程序 开发 工具 的 广泛 知识 和 应 用 。 

本 教程 采用 的 计算 机 程序 设计 语言 是 Python 一 一 一 种 比 大 多 数 语 言 学 习 曲 线 更 加 平滑 
的 语言 。Python 提供 了 强大 的 软件 库 ， 使 得 复杂 的 任务 很 容易 上 手 ， 例 如 开发 图 形 应 用 或 
者 查找 Web 网 页 上 的 所 有 超 链接 。 在 这 本 教科 书 中 ， 我 们 充分 利用 Python 语言 的 易学 性 
和 多 用 性 ， 同 时 使 用 Python 库 进 行 更 多 的 计算 机 科学 研究 ， 并 将 重点 放 在 现代 应 用 程序 
开发 上 。 这 样 做 的 好 处 是 使 得 本 书 充分 介绍 了 计算 和 现代 应 用 程序 开发 领域 的 相关 知识 和 
应 用 。 

本 教程 的 教学 方法 是 以 广度 优先 的 方式 介绍 计算 的 概念 和 Python 程序 设计 知识 。 本 教 
程 的 方法 更 接近 上 自然 语言 的 学 习 方法 ， 从 大 二 通用 的 词汇 开始 ， 逐 渐 扩 展 相 关 知 识 ， 而 不 是 
逐一 罗列 计算 的 概念 和 Python 语言 结构 知识 。 本 教程 采用 面向 问题 的 叙述 方式 ， 只 有 在 需 
有 要 的 时 候 才 介绍 相关 的 计算 概念 、Python 结构 、 算 法 技术 和 其 他 工具 ， 即 采用 了 “在 正确 的 
时 间 使 用 正确 的 工具 ”的 模型 。 

本 教程 采用 了 命令 式 编程 优先 和 面向 过 程 的 程序 设计 理念 ， 但 并 不 回避 在 早期 讨论 对 象 
的 概念 。 当 激发 了 学 生 的 兴趣 并 做 好 思想 准备 之 后 ， 再 讨论 用 户 目 定义 的 类 和 面 癌 对象 的 
程序 设计 。 教 科 书 的 最 后 三 革 和 相关 的 案例 研究 使 用 Web 息 取 、 搜 索引 擎 和 数据 挖掘 的 上 
下 文 来 介绍 一 系列 广泛 的 主题 。 这 些 主题 包括 有 关 递 归 、 正 则 表达 式 、 深 度 优先 搜索 、 数 据 
压缩 和 谷歌 的 MapReduce 框架 的 基本 概念 ， 以 及 诸如 图 形 用 户 界 面 组 件 、HTML 解析 器 、 
SQL、JSON、 输 入 /输出 流 以 及 多 核 编程 的 实用 工具 。 

这 本 教科 书 适 用 于 计算 机 科学 专业 计算 机 科学 和 程序 设计 知识 的 课 符 教学。 本 教程 覆盖 
了 广泛 而 又 基本 的 计算 机 科学 主题 以 及 当前 流行 的 技术 ， 这 些 有 助 于 学 生 广 泛 理解 该 领域 ， 
并 有 信心 开发 与 Web 或 数据 库 交 互 的 “真正 ”的 现代 应 用 程序 。 教 科 书 广泛 的 知识 覆盖 也 
使 得 它 非 党 适合 于 那些 同时 需要 和 擎 握 程序 设计 和 计算 概念 但 又 不 愿意 选修 一 门 或 两 门 以 上 计 
算 课 程 的 学 生 。 


技术 特性 


本 教程 具有 许多 吸引 学 生 的 特性 ， 并 积极 鼓励 学 生动 手 实践 。 首 先 ， 本 书 提供 了 大 量 
基于 Python 的 交互 式 命 令 行 的 示例 。 学 生 可 以 很 容易 地 自己 复制 这 些 代 码 行 。 通 过 运行 这 
些 代码 并 观测 代码 的 执行 结果 ， 学 生 可 能 会 使 用 交互 式 命令 行 的 即时 反馈 来 进行 更 深入 的 
实验 。 

贯穿 整 本 教程 我们 将 一 些 练习 题 穿插 在 正文 当中 ， 其 目的 是 加 深 对 正文 中 刚刚 讨论 过 
的 概念 的 理解 。 这 些 问题 的 答案 包含 在 相应 的 章节 或 者 是 案例 研究 的 末尾 ， 以 允许 学 生 检 查 
他 们 的 答案 是 否 正确 ， 或 者 在 思路 堵塞 的 情况 下 作为 参考 。 

对 于 程序 设计 过 程 中 可 能 出 现 的 潜在 陷阱 ， 本 教程 以 “注意 事项 ”的 形式 来 警示 学 生 。 
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教程 中 还 使 用 “知识 拓展 ”的 形式 来 简要 地 探索 有 趣 但 稍微 偏离 正文 内 容 的 主题 。 正 文中 大 
量 的 练习 题 、 图 和 表 等 ， 为 正文 内 容 提 供 了 更 棒 的 视觉 效果 ， 从 而 使 学 生 更 容易 阅读 和 理解 
正文 内 容 。 

最 后 ， 本 教程 各 草 结 尾 均 包含 了 大 量 的 思考 题 ， 其 中 许多 思考 题 与 人 门 级 教科 书 中 篆 见 
的 思考 题 截 然 不 同 。 

本 教程 的 电子 版 还 提供 额外 的 教学 材料 ， 其 中 包括 11 个 案例 研究 ”。 每 一 个 案例 研究 都 
与 一 章 〈 第 2 一 12 章 ) 的 正文 内 容 相 关联 ， 并 充分 展示 对 应 章节 中 所 涉及 的 概念 和 工具 。 
案例 研究 中 包括 额外 的 思考 题 ， 以 及 相应 的 练习 题 及 其 答案 。 


在 线 补 充 资料 ” 


在 本 教程 的 配套 网 站 上 ， 提 供 了 以 下 补充 资料 : 
e 每 个 章节 的 PowerPoint 教学 幻灯 片 

e 每 个 草 节 的 学 习 目 标 

e 教程 中 出 现 的 所 有 代码 示例 

e 习题 和 思考 题 的 参考 答案 ( 仅 供 教 师 使 用 ) 
e 考试 题 〈( 仅 供 教师 使 用 ) 


致 学 生 : 如 何 阅读 本 教程 


本 教程 的 目的 是 帮助 读者 掌握 程序 设计 和 开发 计算 思维 的 技能 。 程 序 设计 和 计算 思维 是 
实践 行为 ， 除 了 需要 一 台 安 装 了 Python 集成 开发 环境 的 计算 机 以 外 ， 还 需要 用 于 演算 的 纸 
和 笔 。 理 想 情 况 下 ， 当 读者 阅读 本 教程 的 时 候 ， 必 须 拥 有 这 些 工 具 。 

本 教程 大 量 使 用 了 Python 的 交互 式 命 令 行 示例 。 请 读者 尝试 在 命令 行 中 运行 这 些 示 例 。 欢 
迎 读者 进一步 实验 。 请 读者 放心 ， 即 使 你 不 小 心 犯 了 错误 ， 计 算 机 也 不 大 可 能 大 发 雷霆 的 ! 

读者 还 应 该 尝试 完成 正文 中 给 出 的 所 有 练习 题 。 练 习题 的 参考 答案 位 于 相应 章节 的 结 
尾 。 如 果 你 思路 堵塞 了 ， 去 偷 看 一 眼 参 考 答案 也 可 以 , 但 是 偷 看 一 眼 之 后 ， 请 尝试 自己 解决 
问题 而 不 要 继续 偷 看 。 

对 于 编程 过 程 中 潜在 的 陷阱 ， 在 正文 中 使 用 “注意 事项 ”的 形式 来 警示 读者 。 这 些 警 示 
是 非常 重要 的 ， 读 者 阅读 时 不 应 该 跳 过 。"“ 知 识 拓 展 ” 部 分 则 讨论 与 主题 稍微 相关 的 话题 ， 
读者 愿意 的 话 阅 读 时 可 以 跳 过 ,或 者 感 兴趣 的 话 也 可 以 更 加 深入 地 探索 这 些 话题 。 

在 阅读 正文 的 某 些 内 容 的 时 候 ， 读 者 可 能 会 灵感 内 现 ， 想 开发 自己 的 应 用 程序 ， 也 许 是 
一 个 纸牌 游戏 ， 或 一 个 实时 跟 踊 一 系列 股票 市 场 指数 的 应 用 程序 。 如 果 灵 感 内 现 ， 那 就 勇敢 
地 去 尝试 吧 ! 相信 你 一 定 会 收获 满 满 。 


本 教程 概述 


本 教程 共 分 12 章 ， 以 “广度 优先 ”的 方式 介绍 了 计算 概念 以 及 Python 程序 设计 语言 。 
本 教程 的 电子 版 还 包括 案例 研究 ， 展 示 了 教程 各 章 中 所 涵盖 的 概念 和 工具 。 


名 关于 电子 教程 案例 研究 内 容 ， 有 需要 的 读者 请 到 华章 网 站 (www.hzbook.com) 下 载 。 一 一 编辑 注 
电 关于 本 书 教 辅 资源 ， 只 有 使 用 本 书 作为 教材 的 教师 才 可 以 申请 ， 需 要 的 教师 可 向 约翰 威 立 出 版 公司 北京 代 
表 处 申请 ， 电 话 010-84187869， 电 子 邮 件 sliang@wiley. com。 一 -一 编辑 注 
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Python 和 计算 机 科学 导 览 

第 1 章 介 绍 基本 的 计算 概念 和 术语 。 首 先 讨论 计算 机 科学 是 什么 以 及 开发 人 员 做 什么 ， 
并 定义 建 模 、 算 法 设计 和 程序 设计 的 概念 。 然 后 描述 了 计算 机 科学 家 和 应 用 程序 开发 人 员 的 
工具 包 ， 从 逻辑 到 系统 ， 重 点 在 于 程序 设计 语言 、Python 开发 环境 和 计算 思维 。 

第 2 章 介绍 核心 的 内 置 Python 数据 类 型 : 整 型 、 布 尔 型 、 浮 点 型 、 字 符 串 、 列 表 和 元 
组 。 本 章 使 用 Python 交互 式 命 令 行 的 方式 阐述 不 同 数据 类 型 的 特点 。 介 绍 没有 侧重 全 面 性 ， 
而 是 侧重 每 种 数据 类 型 的 用 途 ， 以 及 数据 类 型 之 间 的 差异 和 相似 之 处 。 这 种 方法 可 以 激发 对 
对 象 和 类 的 更 抽象 的 讨论 ， 而 这 对 于 最 终 掌握 数据 类 型 的 正确 用 法 是 必需 的 。 本 教程 电子 版 
中 的 案例 研究 (CS.2 ) 充分 利用 了 这 些 讨论 ， 从 而 引入 了 海 包 图形 类 ， 让 学 生 能 够 交互 式 地 
绘制 价 单 有 趣 的 图 形 。 

第 3 章 介 绍 命令 式 和 面向 过 程 的 程序 设计 ， 包括 基本 的 执行 控制 结构 。 本 草 将 程序 作为 
存储 在 文件 中 的 Python 语句 序列 。 为 了 控制 语句 的 执行 方式 ， 引 入 了 基本 条 件 和 迭代 控制 
结构 : 单 分 支 和 双 分 支 立 E 语句 ， 以 及 迭代 一 个 显 式 序列 或 数字 范围 的 最 简单 的 for 循环 模 
式 。 本 章 介 绍 了 孙 数 ， 作 为 一 种 封装 小 应 用 程序 的 方式 ; 本 和 草 还 在 第 2 草 所 涵盖 的 对 象 和 类 
的 知识 上 上， 描述 了 Python 如何 赋 值 和 传递 参数 。 本 教程 电子 版 中 的 案例 研究 (CS.3 ) 通过 
基于 海 包 图 形 的 可 视 化 上 下 文 ， 激 发 读者 通过 程序 实现 自动 化 ， 并 通过 也 数 实现 抽象 。 

前 三 章 对 Python 程序 设计 和 计算 机 科学 提供 了 一 个 浅显 而 广泛 的 介绍 。 通 过 介绍 
Python 的 核心 数据 类 型 和 基本 执行 控制 结构 ， 学 生 能 够 尽早 上 手 编写 简单 而 完整 的 程序 。 
同时 ， 在 早期 介绍 函数 可 以 帮助 学 生理 解 程序 的 功能 ， 即 程序 所 需要 的 输入 是 什么 ， 以 及 程 
序 产 生 的 输出 是 人 什么。 换言之， 函数 的 抽象 和 封装 是 用 来 帮助 学 生 更 好 地 理解 程序 的 。 

专注 于 算法 思考 

第 4 章 更 深入 地 讨论 了 文本 和 文件 处 理 。 本 草 继 续 讨 论 第 2 草 中 涉及 的 字符 串 知 识 : 字 
符 串 值 的 表示 、 字 符 串 运 算 符 和 方法 ， 以 及 格式 化 输出 。 文 件 输入 /输出 (WO) 也 会 介绍 ， 
特别 是 读 取 文 本 文件 的 不 同 模式 。 最 后 ， 使 用 文件 IO 的 上 下 文 来 激发 对 Python 中 异常 和 
异常 类 型 的 讨论 。 本 教程 电子 版 中 的 案例 研究 (CS.4 ) 讨论 了 图 像 文件 (通常 存储 为 二 进 制 
文件 而 不 是 文本 文件 ) 是 如 何 读 取 和 写 人 的 ， 以 及 如 何 使 用 Python 处 理 图 像 。 

第 5 章 深 入 介绍 执行 控制 结构 和 循环 模式 。 基 本 条 件 和 迭代 结构 在 第 3 曹 中 介绍 ， 然 
后 在 第 4 章 中 使 用 (例如 ， 在读 取 文件 的 上 下 文中 )。 第 5$ 章 一 开始 先 讨 论 多 分 文 条 件 语 句 ， 
其 余 大 部 分 篇 幅 则 用 于 描述 不 同 的 循环 模式 : for 循环 和 while 循环 的 各 种 不 同 使 用 方法 。 
在 讨论 符 套 循环 模式 时 ， 还 引入 了 多 维 列 表 。 本 章 作 为 核心 音节 ， 不 仅 池 盖 了 Python 循环 
结构 ， 还 描述 了 问题 分 解 的 不 同方 式 。 因 此 ， 本 章 从 本 质 上 讨论 了 问题 求解 和 算法 。 本 教程 
电子 版 中 的 案例 研究 (CS.5 ) 分 析 了 图 像 处 理 的 底层 原理 ， 描 述 了 如 何 实现 经 典 的 图 像 处 理 

第 6 章 详 细 介绍 了 Python 内 置 容 需 数据 类 型 及 其 用 法 。 引 出 字典 、 集 合 和 元 组 数据 类 
型 加 以 介绍 。 本 章 还 完成 了 对 字符 串 的 介绍 ， 并 讨论 了 字符 编码 和 Unicode。 最 后 ， 在 讨论 
选择 和 排列 容器 中 的 项 时 引入 了 随机 性 的 概念 。 本 教程 电子 版 中 的 案例 人 研究 (CS.6 ) 利用 本 
章 中 介绍 的 概念 ， 展 示 了 如 何 开发 一 个 21 点 扑克 有 牌 游戏 应 用 程序 。 

第 4 一 6 章 代 表 了 本 教程 所 采取 的 “广度 优先 ”方法 的 第 二 个 层次 。 在 人 门 程序 设计 
课程 中 ， 学 生 所 面临 的 主要 挑战 之 一 是 擎 握 条 件 和 和 迭代 结构 ， 更 一 般 地 说 ， 是 掌握 解决 计 
算 问 题 和 设计 算法 的 技能 。 关 键 的 第 5 章 (关于 如 何 应 用 执行 控制 结构 的 模式 ) 出 现在 学 生 
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学 习 了 基本 条 件 语句 和 和 迭代 模式 的 几 个 星期 后 ， 此 时 他 们 已 经 渐渐 适应 了 Python 语言 。 对 
Python 语言 和 迭代 有 一 定 程度 的 熟悉 之 后 ， 学 生 可 以 专注 于 算法 问题 ， 而 不 是 那些 诸如 如 
何 正确 地 读 取 输入 或 者 格式 化 输出 的 次 要 问题 。 

管理 程序 的 复杂 性 

第 7 章 将 重点 转移 到 软件 开发 过 程 本 身 和 管理 更 大 、 更 复杂 程序 的 问题 上 。 本 章 介 绍 了 
名 称 空间 。 名 称 空间 是 管理 程序 复杂 性 的 基础 。 本 章 建立 在 第 3 章 阴 数 和 参数 传递 的 基础 
上 ， 引 出 了 代码 重用 、 模 块 化 和 封装 的 软件 工程 目标 。 函 数 、 模 块 和 类 是 可 以 用 来 实现 这 些 
目标 的 工具 ， 本 质 上 是 因为 它们 定义 了 单独 的 名 称 空间 。 本 章 描 述 了 如 何在 正常 控制 流 和 
异常 控制 流 ( 当 异常 由 异常 处 理 程序 处 理 时 ) 中 管理 名 称 空间 。 本 教程 电子 版 中 的 案例 研究 
(CS.7 ) 基于 本 童 的 内 容 展示 了 如 何 使 用 调试 融 查 找 程 序 中 的 错误 ， 或 者 更 一 般 地 ， 如 何 使 
用 调试 硕 分 析 程序 的 执行 情况 。 

第 8 章 涵 盖 了 Python 中 新 类 的 开发 和 面 回 对 象 程序 设计 (OOP) 的 范式 。 本 章 以 第 
7 章 揭 示 的 “类 通过 名 称 空间 实现 ”为 基础 ， 解 释 如 何 开发 新 的 类 。 本 章 通 过 运算 符 重 载 
(Python 设计 理念 的 中 心 ) 介绍 了 面 回 对 象 程序 设计 的 概念 ， 以 及 继承 (强大 的 面 回 对 象 程 
序 设计 属性 ， 将 在 第 9 章 和 第 11 章 加 以 应 用 )。 通 过 抽象 和 封装 ， 类 实现 了 模块 化 和 代码 重 
用 的 软件 工程 目标 。 然 后 通过 抽象 和 封装 的 讨论 来 引出 用 户 自 定 义 的 异常 类 。 本 教程 电子 版 
中 的 案例 研究 (CS.8 ) 进一步 前 述 了 用 户 目 定 义 容 需 类 中 迭代 行为 的 实现 。 

第 9 章 介 绍 了 图 形 用 户 界面 (GUI)， 展 示 了 面向 对 象 方法 在 开发 图 形 用 户 界 面 中 的 强大 
之 处 。 本 章 使 用 Python 的 Tk 组件 工具 包 ， 它 是 Python 标准 库 的 一 部 分 。 本 章 中 讨论 如 何 
利用 交互 式 组 件 实 现 事 件 驱 动 编程 模式 。 除 了 介绍 图 形 用 户 界面 开发 外 ， 本 章 还 展示 了 如 何 
使 用 面向 对 象 程序 设计 的 强大 功能 来 实现 模块 化 和 可 重用 的 程序 。 本 教程 电子 版 中 的 案例 人 研 
究 (CS.9 ) 通过 实现 基本 计算 器 图 形 用 户 界面 的 过 程 证 实 了 这 一 强大 功能 。 

第 7 ~ 9 章 的 主要 目标 是 向 学 生 介绍 程序 复杂 性 和 代码 组 织 问题 。 这 几 章 描述 如 何 使 
用 名 称 空 间 来 实现 功能 的 抽象 和 数据 的 抽象 ， 并 最 终 实现 封装 的 、 模 块 化 的 、 可 重用 的 代 
人 码 。 第 8 章 全 面 讨论 了 用 户 自 定义 类 和 面 回 对 象 程序 设计 。 然 而 ， 面 向 对 象 程序 设计 的 优越 
性 在 实际 应 用 中 才能 最 好 地 体现 ， 而 这 正 是 第 9 章 的 内 容 。 其 他 有 关 面 回 对 象 程序 设计 的 应 
用 和 实例 将 在 后 续 章 节 陆 续 讨 论 ， 特 别 是 11.2 节 、12.3 节 、12.4 节 以 及 第 10 章 的 案例 研究 
CS.10。 第 7 一 9 章 为 学 生 将 来 在 数据 结构 和 软件 工程 方法 方面 的 学 习 提 供 了 基础 。 

知识 深入 和 高 级 应 用 

第 10 ~ 12 章 是 本 教程 的 最 后 三 章 ， 涵 盖 了 各 种 高 级 主题 ， 从 基本 的 计算 机 科学 概念 
(例如 递归 、 正 则 表达 式 、 数 据 压 缩 和 深度 优先 搜索 征 ) 到 实用 的 现代 工具 (例如 HTML 解 
析 融 、JSON 、SQL 和 多 核 编程 等 )。 文 中 通过 开发 诸如 Web 爬虫 程序 、 搜 索引 擎 和 数据 挖 
掘 应 用 程序 来 引出 这 些 高 级 主题 并 将 它们 连接 起 来 。 然 而 ， 这 些 主题 是 松散 的 ， 并 且 每 一 个 
单独 的 主题 都 是 独立 呈现 的 ， 目 的 是 允许 教师 根据 他 们 认为 合适 的 材料 来 设计 不 同 的 应 用 上 
下 文 和 主题 。 

第 10 章 介 绍 了 计算 机 科学 的 基本 主题 : 递归 、 查 找 和 算法 的 运行 时 间 分 析 。 本 章 一 
开始 即 讨论 递归 思想 。 然 后 将 这 种 技巧 应 用 于 从 绘制 分 形 图 到 病毒 扫描 的 各 种 各 样 的 问题 
上 。 本 章 最 后 一 个 例子 用 于 曾 述 深度 优先 搜索 。 递 归 的 优点 和 缺点 导致 算法 运行 时 间 分 析 
的 讨论 。 然 后 将 算法 运行 时 间 的 分 析 应 用 于 各 种 查找 算法 性 能 的 分 析 。 本 曹 把 重点 放 在 计 
算 的 理论 方面 ， 以 便 为 今后 的 数据 结构 和 算法 课程 商定 基础 。 本 教程 电子 版 中 的 案例 研 





究 (CS.10 ) 讨论 了 汉 诺 塔 问题 ， 展 示 了 如 何 开发 一 个 可 视 化 的 应 用 程序 来 说 明 递归 解决 
邦 案 。 
第 11 章 介 绍 了 万 维 网 一 一 一 个 中 央 计算 平台 ， 同 时 也 是 一 个 创新 计算 机 应 用 程序 开发 
的 巨大 数据 源 。 在 讨论 访问 Web 上 的 资源 和 解析 Web 页 面 的 工具 之 前 ， 对 Web 语言 HTML 
进行 了 简要 讨论 。 为 了 从 Web 页 面 和 其 他 文本 内 容 中 抓 取 所 需 的 内 容 ， 首 先 介绍 了 正则 表 
达 式 。 在 入 门 课程 中 接触 HTML 解析 和 正则 表达 式 的 好 处 是 ,学 生 在 学 习 正规 语言 课程 之 
前 ， 将 熟悉 其 在 应 用 中 的 用 法 。 本 教程 电子 版 中 的 案例 研究 ( CS.11 ) 利用 本 章 中 所 涉及 的 
不 同 主题 来 展示 一 个 基本 的 Web 疏 虫 程序 的 开发 过 程 。 

第 12 章 介 绍 数据 库 和 大 型 数据 集 的 处 理 。 在 讲述 如 何 存储 从 网 页 中 抓 取 的 数据 时 ， 简 
要 地 介绍 了 数据 库 查 询 语言 SQL 以 及 一 个 Python 数据 库 应 用 编程 接口 。 鉴 于 当今 计算 机 应 
用 数据 库 的 普及 ， 建 议 学 生 尽早 接触 数据 库 及 其 使 用 (如 果 没 有 其 他 的 理由 ， 应 该 在 第 一 次 
实习 前 熟悉 数据 库 )。 数 据 库 和 SQL 的 讨论 只 是 介绍 性 的 ， 应 该 被 看 作 以 后 数据 库 课 程 的 基 
础 。 本 章 还 讨论 了 如 何 利用 计算 机 上 可 用 的 多 个 内 核 更 快速 地 处 理 大 数据 集 。 本 章 还 介绍 
了 谷歌 公司 的 问题 解决 框架 MapReduce， 并 在 此 应 用 中 介绍 了 列表 解析 和 函数 式 编程 范式 。 
本 音 为 进一步 研究 数据 库 、 程 序 设计 语言 和 数据 挖掘 奠定 了 基础 。 本 教程 电子 版 中 的 案例 研 
究 (CS.12 ) 采用 这 一 背景 来 讨论 数据 交换 ,或 者 如 何 格式 化 并 保存 数据 ， 以 便 任何 需要 这 
些 数据 的 程序 可 以 方便 高 效 地 访问 它们 。 


第 2 版 新 内 容 


本 教程 的 第 1 版 和 第 2 版 之 间 的 最 大 变化 是 结构 性 调整 。 各 章 所 涵盖 的 基本 知识 和 用 于 
描述 基本 概念 的 案例 研究 在 第 2 版 中 实现 了 明确 的 分 离 。 案 例 研究 已 经 从 各 章节 中 分 离 出 
来 ,在 第 2 版 中 包含 在 教程 的 电子 版 中 。 这 种 结构 性 变化 有 两 个 好 处 。 第 一 个 好 处 是 ,教科 
书 章节 可 以 更 加 专注 于 基本 知识 。 第 二 个 好 处 是 ， 可 以 为 案例 研究 提供 更 多 的 空间 。 新 版 本 
中 出 现 了 四 个 新 的 案例 研究 ， 教 程 中 每 一 章 (除了 “ 非 技 术 性 ”的 介绍 性 章节 ) 都 关联 了 一 
个 案例 人 研究 。 

除了 这 种 结构 性 的 变化 ， 教 程 还 增加 、 删 除了 一 些 内 容 ， 纠 正 了 一 些 错误 ,改进 了 一 些 
表述 方式 。 以 下 我 们 将 一 一 罗列 出 这 些 变 化 

在 第 2 章 中 ， 我 们 增加 了 元 组 数据 类 型 的 讨论 (包含 在 第 1 版 的 第 6 章 中 )。 这 一 举措 
是 合理 的 ， 因 为 在 Python 中 ， 元 组 数据 类 型 是 一 种 关键 的 内 置 数 据 类 型 ， 并 被 许多 标准 库 
模块 和 Python 应 用 程序 所 使 用 。 例 如 ， 与 第 4 章 和 第 $ 章 相 关 的 案例 研究 中 讨论 的 图 像 处 
理 模块 就 使 用 了 元 组 对 象 。 因 为 元 组 数据 类 型 与 列表 数据 类 型 非常 相似 ， 所 以 增加 这 个 内 容 
不 会 让 第 2 章 的 讨论 时 间 延 长 多 少 。 

在 第 3 章 中 ,改进 了 曾 述 函数 的 方式 。 特 别 是 提供 了 更 多 的 例子 和 练习 题 以 帮助 说 明 如 
何 传递 不 同 数量 和 类 型 的 函数 参数 。 第 4 章 的 案例 研究 被 蔡 换 为 新 的 关于 处 理 网 像 文件 的 应 
用 程序 。 新 的 案例 研究 给 了 学 生 一 个 令 人 兴奋 的 机 会 ， 他 们 可 以 在 视觉 媒体 的 应 用 中 查看 教 
程 内 容 。 同 时 ,处理 和 格式 化 日 期 、 时 间 和 字符 串 的 内 容 被 移动 到 4.2 节 。 在 第 2 版 中 ， 重 要 
的 第 5 章 有 一 个 实现 图 像 处 理 算法 的 相关 案例 人 研究。 这 部 分 内 容 下 次 利用 视觉 媒体 的 吸引 人 
的 应 用 过 程 来 阐述 基 本 概念 (例如 骸 套 循环 )。 

第 6 章 不 再 包括 元 组 数据 类 型 的 讨论 (被 移 至 第 2 章 中 )。 在 第 2 版 的 第 7 章 中 包括 了 
一 个 调试 和 调试 器 使 用 的 相关 案例 研究 。 它 有 效 地 利用 了 本 章 所 涵盖 的 概念 ， 为 学 生 提 供 





了 一 种 新 工具 ， 帮 助 他 们 进行 程序 的 调试 。 第 8 章 和 第 9 章 只 是 略 有 变化 。 第 10 章 对 线性 
递归 及 其 与 迭代 的 关系 进行 了 更 为 深入 的 研究 。 第 11 章 儿 乎 没有 变化 。 最 后 ， 在 第 2 版 的 
第 12 章 中 提供 了 一 个 数据 交换 的 相关 案例 研究 ， 它 将 帮助 学 生 获 得 使 用 数据 集 的 相关 实践 
经 验 。 

最 后 ， 第 2 版 教程 中 增加 了 大 约 60 道 练习 题 和 章节 后 面 的 思考 题 。 


致 教师 : 如 何 使 用 本 教程 


本 教程 的 内 容 是 为 两 个 学 期 的 课程 设计 的 ， 主 要 针对 计算 机 科学 和 计算 机 科学 程序 设计 
专业 的 学 生 。 本 教程 的 内 容 足 够 一 个 典型 的 15 周 的 课程 使 用 (可 能 正好 适合 于 准备 充分 并 
且 积 极 性 很 高 的 学 生 )。 

本 教程 的 前 六 章 全 面 履 盖 了 Python 语言 中 命令 式 /面向 过 程 的 程序 设计 部 分 。 它 们 应 
该 按 顺序 讨论 ， 但 也 可 以 在 学 习 第 4 章 之 前 学 习 第 5 章 。 此 外 ， 还 可 以 跳 过 第 6 章 的 内 容 ， 
然后 在 需要 的 时 候 回 过 头 来 再 学 习 。 

为 了 有 效 地 展示 面 回 对象 程序 设计 ， 建 议 按照 顺序 依次 学 习 第 7 一 9 章 的 内 容 。 在 学 
习 第 8 章 之 前 建议 先 学 习 第 7 章 ， 这 点 非常 重要 ， 因 为 第 7 草 揭 开 了 Python 类 实现 的 神秘 
面纱 ， 从 而 使 得 学 生 可 以 更 加 有 效 地 学 习 面 向 对 象 程序 设计 主题 (例如 运算 符 重 载 和 继承 ) 。 
同样 ， 在 学 习 第 8 章 之 后 再 学 习 第 9 章 也 是 非常 有 益 的 (但 不 是 必须 如 此 )， 因 为 第 8 章 提 
供 了 一 个 应 用 ， 其 中 展示 了 面向 对 象 程序 设计 的 巨大 优越 性 。 

第 9 一 12 草 都 是 可 选 内 容 ， 它 们 仅仅 依赖 于 第 1 ~ 6 间 的 内 容 (当然 也 有 少量 扩充 的 
知识 点 )， 其 包含 的 内 容 一 般 可 以 跳 过 或 者 由 任课 教师 自由 编排 授课 顺序 。 扩 充 的 知识 点 位 
于 9.4 节 ( 它 演示 了 如 何 使 用 面向 对 象 的 程序 设计 方法 开发 图 形 用 户 界面 )， 以 及 11.2 节 、 
12.3 节 和 12.4 节 (它们 都 使 用 了 用 户 自 定义 的 类 )。 所 有 这 些 知识 均 依赖 于 第 8 章 中 的 内 容 。 

在 授课 中 使 用 本 教程 但 计划 将 有 关 面 向 对 象 程序 设计 的 知识 留 给 后 续 课 程 的 教师 ， 可 以 
先 讲 授 第 1 ~~ 7 章 的 内 容 ， 然 后 从 第 9 ~ 12 章 中 选择 非 面向 对 象 程序 设计 部 分 的 主题 内 容 
进行 授课 。 对 于 那些 希望 讲授 面向 对 象 程序 设计 知识 的 教师 ， 应 该 使 用 第 1 一 9 章 的 内 容 ， 
然后 从 第 10 一 12 章 中 选择 相应 主题 进行 授 谍 。 


致谢 


本 教程 第 1 版 的 内 容 材料 是 在 DePaul 大 学 教授 CSC241/242 课程 序列 (计算 机 科学 导论 
I 和 了 1) 的 三 年 多 时 间 里 开发 设计 的 。 在 这 三 年 中 ，6 个 不 同年 级 的 计算 机 科学 专业 的 新 生 学 
完了 本 课程 系列 。 我 在 不 同 的 学 生 群 体 中 尝试 不 同 的 教学 方法 ， 重 新 安排 和 重组 教程 中 的 内 
容 材料 ， 并 尝试 教授 给 学 生 入 门 级 程序 设计 课程 中 通常 不 教 的 主题 内 容 。 不 断 的 重组 和 实验 
使 得 课程 内 容 材料 不 太 流 畅 ， 但 更 具 挑 战 性 ， 特 别 是 对 于 早期 的 学 习 群 体 。 令 人 惊奇 的 是 ， 
虽然 学 生 在 本 课程 中 所 得 到 的 分 数 不 高 ， 但 他 们 依旧 热情 不 减 ， 这 反 过 来 又 帮助 我 维持 了 热 
情 。 我 囊 心 感谢 他 们 。 

我 衷心 感谢 DePaul 大 学 计算 机 学 院 的 教师 和 管理 人 员 ， 他 们 创造 了 一 个 真正 独特 的 学 
术 环 境 ， 敦 励 教育 实验 与 创新 。 他 们 中 的 一 些 人 也 直接 参与 了 本 教程 的 创作 和 修订 。 副 院 
长 Lucia Dettori 合理 安排 了 我 的 课程 以 便 我 有 时 间 写 作 。Curt White 是 一 位 经 验 丰富 的 教 
科 书 作者 ， 他 积极 鼓励 我 开始 写作 ， 并 极力 回 John Wiley & Sons 出 版 社 推荐 我 。Massimo 
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DiPierro 是 web2py Web 框架 的 创始 者 ， 同 时 也 是 我 永远 无 法 比肩 的 Python 权威 ， 他 为 
CSC241/242 系列 课程 的 内 容 制 定 了 第 一 份 大 纲 ， 而 这 是 本 教材 最 初 的 种 子 。Iyad Kanj 首开 
诬 程 CSC241， 并 无 私 地 允许 我 使 用 他 开发 的 材料 。Amber Settle 是 除 我 之 外 第 一 次 使 用 本 
教程 授 诛 的 教师 ， 谢 天 谢 地 ， 她 取得 了 巨大 的 成 功 ， 这 个 成 功 归功 于 她 本 身 就 是 一 个 优秀 的 
教师 。 在 我 所 认识 的 人 中 ，Craig Miller 最 深入 地 思考 并 阐述 了 计算 机 科学 的 基本 概念 。i 
过 和 他 之 间 的 许多 有 趣 的 讨论 ， 我 获得 了 一 些 见 解 ， 本 教程 因此 也 受益 匪 浅 。 最 后 ，Marcus 
Schaefer 对 本 教程 一 半 以 上 的 内 容 进 行 了 彻底 的 技术 审查 ， 大 大 改进 和 完善 了 本 教程 的 
内 容 。 

如 果 没 有 Wiley 出 版 社 教科 书 代 理 Nicole Dingley 的 建议 ， 我 的 课程 讲义 将 停留 在 讲 
义 层 面 而 不 会 编辑 成 书 。Nicole 把 我 与 Wiley 出 版 社 的 编辑 Beth Golub 联系 在 一 起 。 感 
谢 Beth 做 出 了 一 个 勇敢 的 决定 ， 选 择 信任 一 个 拥有 奇怪 的 名 字 并 且 没 有 教材 写作 经 验 的 
外 国人 来 编写 教科 书 。Wiley 出 版 社 的 高 级 设计 师 Madelyn Lesure， 以 及 我 的 朋友 兼 邻 居 
Mike Riordan， 帮 助 我 实现 了 简单 整洁 的 正文 设计 。 最 后 ，Wiley 出 版 社 的 高 级 编辑 助理 
Samantha Mandel 不 知 疲倦 地 让 我 的 各 草草 稿 进 入 审阅 和 出 版 环节 。 在 整个 教材 出 版 过 程 
中 ，Samantha 一 直 是 一 个 职业 化 和 优雅 的 典范 ， 她 为 这 本 教材 提出 了 无 数 精彩 的 建议 和 意 
见 ， 使 得 本 教材 更 加 出 色 。 

这 本 书 的 最 终 版 本 只 是 表面 上 看 起 来 与 最 初 的 草稿 类 似 。 相 对 于 初始 版 本 ， 教 材 最 终 
版 取得 了 长 足 的 改善 ， 这 归功 于 数 十 位 评审 者 (其 中 很 多 是 匿名 )。 阳 生 人 的 善意 使 本 教材 
变 得 更 完美 ， 而 这 也 使 得 我 对 教材 审阅 过 程 有 了 新 的 认识 。 审 阅 者 们 不 仅 能 发 现 问题 ， 而 
且 有 提供 解决 方案 的 热情 。 我 万 分 感谢 他 们 认真 而 系统 的 反馈 。 一 些 审阅 者 (包括 David 
Mutchler (罗斯 霍 曼 理工 学 院 )， 提 供 了 他 的 姓名 和 电子 邮件 给 我 以 保持 进一步 通信 联系 ) 超 
越 其 职责 范围 ， 帮 助 挖掘 深 埋 在 我 的 早期 草稿 中 的 潜在 问题 。Jonathan Lundell 还 对 本 教材 
最 后 一 草 提 供 了 技术 审阅 。 由 于 时 间 上 的 限制 ， 我 没 能 把 收 到 的 所 有 有 价值 的 建议 都 纳入 教 
材 中 ， 对 教材 中 任何 踊 漏 的 责任 完全 由 我 自己 承担 。 

我 要 特别 感谢 使 用 本 教程 第 1 版 授课 并 给 予 我 宝贵 反馈 意见 的 教师 们 : Ankur Agrawal 
(曼哈顿 学 院 ),Albert Chan ( 费 耶 特 维尔 州立 大 学 ),Gabriel Ferrer (汉人 德里 克 斯 学 院 ), David G. 
Kay (加 利 福 尼 亚 大 学 欧文 分 校 )，Gerard Ryan (新 泽 西 科技 学 院 )，Sridhar Seshadri (得 克 萨 
斯 大 学 阿 灵 顿 分 校 )，Richard Weiss( 常 青州 立 大 学 )，Michal Young (俄勒冈 大 学 ) 等 。 我 已 
经 尽力 在 第 2 版 中 采纳 他 们 的 建议 。 

最 后 ， 我 要 感谢 我 的 爱人 Lisa 和 女儿 Marlena、Eleanor， 感 谢 她 们 给 予 我 的 耐心 。 编 写 
一 本 教材 需要 花费 大 量 的 时 间 ， 而 这 些 时 间 只 能 来 自家 庭 时 间或 睡眠 时 间 ， 因 为 其 他 职业 责 
任 均 有 其 设 定 的 时 间 。 编 写 这 本 教材 花费 的 时 间 使 得 我 常常 无 法 参加 家 庭 活 动 ， 或 者 由 于 睡 
眠 不 足 而 导致 脾气 不 好 。 第 运 的 是 ， 我 有 先 见 之 明 ， 在 开始 这 个 项 目的 时 候 领 养 了 一 只 狗 。 
虽然 在 家 庭 活动 中 的 缺席 珊 来 了 很 多 遗憾 和 失望 ， 但 这 只 名 叫 Muffin 的 狗 无 疑 为 我 的 家 庭 
带 来 了 更 多 的 快乐 …… 所 以 ， 还 要 感谢 Muffin 。 


关于 作 震 


Ljubomir Perkovic 是 芝加哥 DePaul 大 学 计算 学 院 的 副教授 。 他 于 1990 年 在 纽约 城市 大 
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计算 机 科学 嘻 论 





本 草 为 导论 草 ， 我们 将 介绍 本 教程 的 应 用 上 下 文 场景 ， 以 及 贯穿 整 本 教程 所 涉及 的 关键 
概念 和 术语 。 我 们 将 以 硅 干 问题 作为 讨论 的 起 始点 : 什么 是 计算 机 科学 ?计算 机 科学 家 和 计 
算 机 应 用 程序 开发 人 员 的 工作 是 什么 ”他 们 使 用 什么 工具 ? 

计算 机 (或 更 一 般 的 计算 机 系统 ) 组 成 了 一 个 工具 集 。 我 们 将 讨论 一 个 计算 机 系统 的 不 
同 组 成 部 分 ， 包 括 便 件 、 操 作 系 统 、 网 络 和 互联 网 以 及 用 于 编写 程序 的 程序 设计 语言 。 特 别 
地 ， 我 们 将 介绍 关于 本 教程 使 用 的 Python 程序 设计 语言 的 一 些 背 景 知识 。 

另 一 个 工具 集 是 逻辑 推理 。 逻 辑 推理 基于 逻辑 学 和 数学 ， 是 开发 计算 机 应 用 程序 的 必 备 
能 力 。 我 们 将 介绍 计算 思维 的 思想 ， 以 及 如 何在 开发 一 个 小 型 Web 搜索 应 用 程序 中 使 用 计 
算 思 维 。 

本 草 介绍 的 基本 概念 和 术语 独立 于 Python 程序 设计 语言 。 它 们 适用 于 所 有 的 应 用 程序 
开发 ， 与 所 来 用 的 硬件、 软件 平台 或 程序 设计 语言 无 关 。 


1.1 计算 机 科学 


本 教程 既是 程序 设计 导论 ， 也 是 Python 程序 设计 语言 导论 ,但 更 主要 的 是 计算 导论 ， 
即 如何 从 计算 机 科学 的 角度 看 世界 。 为 了 理解 这 个 观点 以 及 定义 计算 机 科学 是 什么 ， 让 我 们 
先 看 看 计算 机 专业 人 员 都 做 些 什 么 。 


1.1.1 计算 机 专业 人 员 的 工作 

计算 机 专业 人 员 做 什么 ”一 个 答案 是 : 他 们 编写 程序 。 是 的 ， 许 多 计算 机 专业 人 员 都 编 
写 程序 。 然 而 ， 说 他 们 编写 程序 ， 就 像 说 剧 作 家 〈 即 编写 电影 或 电视 剧 剧本 的 作家 ) 编写 剧 
本 。 从 观看 电影 的 经 验 来 看 ， 我 们 发 现 : 剧 作 家 创造 出 一 个 世界 ， 并 创造 故事 情节 ， 以 满足 
电影 观众 想 理解 人 类 本 质 的 需求 。 好 吧 ， 并 不 是 所 有 的 剧 作家 都 能 做 到 。 

让 我 们 再 次 尝试 定义 计算 机 专业 人 员 做 什么 。 事 实 上 ， 很 多 计算 机 专业 人 员 并 不 编写 程 
序 。 而 编写 程序 的 计算 机 专业 人 员 中 ， 他 们 真正 在 做 的 实际 上 是 开发 用 来 满足 人 类 日 常 活动 
中 需求 的 计算 机 应 用 程序 。 这 些 计算 机 专业 人 员 通 稼 又 称 为 计算 机 应 用 程序 开发 人 员 ， 或 简 
称 开 发 人 员 。 一 些 开 发 人 员 也 开发 类 似 于 虚拟 世界 的 应 用 程序 (例如 ， 电 脑 游 戏 )， 实 现 剧 
作家 编写 的 复杂 的 情节 和 故事 。 

并 非 所 有 开发 人 员 都 开发 计算 机 游戏 。 有 些 开 发 人 员 为 投资 银行 家 创建 金融 工具 ， 还 有 
一 些 为 医生 创建 可 视 化 工具 (其 他 示例 可 以 参见 表 1-1 )。 

表 1-1 计算 机 科学 的 应 用 范围 。 其 中 列举 了 人 类 的 日 常 活动 ， 以 及 对 应 的 计算 机 应 用 程序 

开发 人 员 开 发 的 支持 该 活动 的 软件 产品 的 示例 


日 常 活动 计算 机 应 用 程序 
国防 用 于 目标 检测 与 跟踪 的 图 像 处 理 软 件 


驾驶 基于 GPS 的 智能 手机 的 交通 导航 软件 及 专用 导航 人 硬件 


日 常 活动 计算 机 应 用 程序 

教育 用 于 危险 或 昂贵 的 生物 实验 室 实验 的 模拟 软件 

农业 基于 卫星 的 农场 管理 软件 ， 跟 踪 土 壤 特 性 并 预测 农作物 收成 
电影 为 电影 制作 计算 机 生成 图 像 的 三 维 计算 机 图 形 软件 

媒体 电视 节日 、 电 影 和 视频 剪辑 的 点 播 、 实 时 视频 流 

医疗 病人 记录 管理 软件 ， 以 促进 医学 专家 之 间 的 交流 和 共享 
物理 计算 粒子 加 速 带 数据 的 计算 网 格 系统 

政治 活动 文 持 实时 通信 相信 息 共 享 的 社交 网 络 技术 

购物 推 存 系统 ， 推 送 购物 者 感 兴趣 的 产品 

空间 探索 火星 探索 漫游 者 ， 分 析 土 壤 、 寻 找 水 的 证 据 


那 并 不 是 开发 人 员 的 计算 机 专业 人 员 和 都 做 些 什么 呢 ? 这 些 人 当中 有 些 负 责 与 客户 沟通 ， 
以 获取 计算 机 应 用 的 开发 需求 。 

还 有 一 些 计算 机 专业 人 员 是 管理 应 用 程序 开发 团队 的 经 理 。 一 些 计算 机 专业 人 员 为 安装 
新 软件 的 客户 提供 技术 支持 ， 而 其 他 计算 机 专业 人 员 则 使 软件 保持 最 新 状态 。 许 多 计算 机 专 
业 人 员 管 理 网 络 、Web 服务 可 或 者 数据 库 服 务 化 。 闫 工 计算 机 专业 人 员 设 计 客 户 与 应 用 程序 
交互 的 接口 。 还 有 一 些 计算 机 专业 人 员 (例如 本 教程 的 作者 ) 豆 欢 教授 计算 机 知识 ， 其 他 计 
算 机 专业 人 员 则 提供 信息 技术 (IT) 咨询 服务 。 最 后 ， 越 来 越 多 的 计算 机 专业 人 士 成 为 企业 
家 ,并 开始 了 新 的 软件 业务 ， 其 中 许多 人 的 名 和 字 已 经 家 喻 户 晓 。 

不 管 他 们 在 计算 世界 中 最 终 扮演 什 么 样 的 角色 ， 所 有 的 计算 机 专业 人 员 才 懂得 计算 的 基 
本 原理 ， 计 算 机 应 用 程序 是 如 何 开发 的 ， 以 及 它们 是 如 何 工作 的 。 因 此 ， 对 计算 机 专业 人 员 
的 培训 总 是 从 擎 握 程 序 设 计 语 言 和 软件 开发 过 程 开 始 。 为 了 用 一 般 的 术语 来 摘 述 这 个 过 程 ， 
我 们 需要 使 用 一 些 更 抽象 的 术语 . 


1.1.2 模型 、 算 法 和 程序 


为 了 创建 一 个 满足 人 类 活动 某 方面 需求 的 计算 机 应 用 程序 ， 开 发 人 员 将 构建 一 个 模型 ， 
该 模型 表示 活动 发 生 的 “真实 世界 ”环境 。 模 型 是 真实 环境 的 一 种 抽象 (虚拟 ) 的 表示 ， 并 
使 用 逻辑 和 数学 的 声言 来 描述 。 模 型 可 以 代表 计算 机 游戏 中 的 对 象 、 股 票 市 场 指数 、 人 体 融 
官 或 者 飞机 上 的 座位 。 

开发 人 员 还 会 构建 在 模型 中 运行 的 算法 ， 用 于 创建 、 转 换 、 呈 现 信 息 。 算 法 是 一 系列 指 
令 ， 与 亮 饪 食谱 不 无 类 似 。 每 一 条 指令 以 一 种 非常 明确 和 完整 定义 的 方式 处 理 信 息 ， 并 且 算 
法 指令 的 执行 达到 了 预期 的 目标 。 例 如 ， 一 种 算法 可 以 计算 计算 机 游戏 中 物体 之 间 的 碰撞 ， 
或 查找 飞机 上 可 用 的 经 济 舱 座位 。 

开发 算法 的 最 大 优点 是 可 以 实现 算法 的 自动 执行 。 在 椅 建 了 一 个 模型 和 一 个 算法 之 后 ， 
开发 人 员 将 该 算法 作为 一 个 计算 机 程序 来 实现 ,该 程序 可 以 在 计算 机 系统 上 执行 。 虽然 算法 
和 程序 都 是 关于 如 何 实 现 目 标的 分 步 指令 的 描述 ， 但 是 算法 是 用 我 们 理解 但 不 能 由 计算 机 
系统 执行 的 语言 来 描述 的 ， 而 程序 则 是 用 我 们 理解 并 且 可 以 在 计算 机 系统 上 执行 的 语言 来 描 
述 的 ， 

在 本 草 的 最 后 ， 也 就 是 1.4 节 中 ， 我 们 将 通过 一 个 示例 任务 ， 阐 述 构建 完成 该 任务 的 模 
型 和 算法 的 详细 步 又。 
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1.1.3 必 备 的 工具 


我 们 已 经 提 及 知 干 开发 人 员 在 开发 计算 机 应 用 程序 时 所 使 用 的 工具 。 从 根本 上 来 说 ， 开 
发 人 员 使 用 逻辑 和 数学 来 构建 模型 和 算法 。 在 过 去 的 半 个 多 世纪 里 ,计算 机 科学 家 们 已 经 基 
于 逻辑 和 数学 建立 了 信息 和 计算 的 理论 基础 的 广阔 知识 体系 。 开 发 人 员 在 工作 中 要 应 用 这 些 
知识 ,计算机 科学 的 大 部 分 训练 包括 擎 握 这 方面 的 知识 ， 而 这 本 教程 是 培训 的 第 一 步 。 

开发 人 员 使 用 的 男 一 组 工具 当然 是 计算 机 ， 或 者 更 一 般 的 计算 机 系统 。 它 们 包括 人 硬件、 
网 络 、 操 作 系 统 ， 以 及 程序 设计 语言 和 程序 设计 语言 工具 。 我 们 将 在 1.2 节 中 详细 地 描述 所 
有 这 些 系统 。 虽然 理论 基础 经 党 超越 技术 的 变化 ， 但 计算 机 系统 工具 也 在 不 断 演进 。 几 乎 
每 天 都 会 出 现 更 快 的 人 硬件、 改进 的 操作 系统 和 新 的 程序 设计 语言 ， 以 适应 未 来 的 应 用 程序 
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1.1.4 什么 是 计算 机 科学 


我 们 已 经 描述 了 应 用 程序 开发 人 员 所 做 的 工作 ， 以 及 他 们 所 使 用 的 工具 。 那 么 到 底 什么 
是 计算 机 科学 ? 它 与 计算 机 应 用 程序 开发 有 什么 关系 ? 

虽然 大 多 数 计 算 机 专业 人 员 为 计算 领域 以 外 的 用 户 开 发 应 用 程序 ， 但 有 些 人 正在 研究 和 
创建 开发 人 员 使 用 的 理论 和 系统 工具 。 计 算 机 科学 领域 包括 这 类 工作 。 计 算 机 科学 可 以 定义 
为 全 究 信息 和 计算 的 理论 基础 及 其 在 计算 机 系统 上 的 实际 实现 。 

应 用 程序 开发 坚 无 疑问 是 计算 机 科学 领域 的 核心 驱动 力 ， 但 其 涉及 的 范围 更 广 。 计 算 机 
科学 家 开发 的 计算 技术 被 用 来 妍 究 关 于 信息 、 计 算 和 智能 的 本 质 的 问题 。 它 们 也 被 用 于 其 他 
学 科 ， 以 帮助 我 们 了 解 和 领会 我 们 周围 的 目 然 现象 和 人 为 现象 ,例如 物理 学 中 的 相 变 或 者 社 
会 学 中 的 社交 网 络 。 事 实 上 ,一些 计 算 机 科学 家 正在 致力 于 人 研究 和 科学、 数学、 经 济 学 和 其 他 
领域 中 一 些 最 具 挑 战 性 的 问题 。 

应 该 强调 的 是 ， 应 用 程序 开发 和 计算 机 科学 之 间 的 边界 (以 及 应 用 程序 开发 人 员 和 计算 
机 科学 家 之 间 的 边界 ) 通常 无 法 清晰 界定 。 计 算 机 科学 的 许多 理论 基础 部 是 从 应 用 程序 开发 
得 来 的 ， 而 理论 计算 机 科学 的 研究 常 弟 导致 计算 机 的 创新 应 用 。 因 此 ， 许 多 计算 机 专业 人 员 
同时 充当 两 个 角色 : 开发 人 员 和 计算 机 科学 家 。 


1.2 计算 机 系统 


计算 机 系统 由 便 件 和 软件 组 成 ， 和 它们 共同 执行 应 用 程序 。 人 硬件 包括 物理 组 件 ， 即 可 以 触 
措 到 的 组 件 ， 如 内 存心 片 、 键 盘 、 网 络 电 弦 或 关 能 手机 。 软 件 包括 计算 机 的 所 有 非 物理 组 
件 ， 包 括 操作 系统 、 网 络 协 议 、 程 友 设 计 语 言 工具 和 相关 的 应 用 程序 编程 接口 (AP1)。 


1.2.1 计算 机 硬件 


计算 机 硬件 指 的 是 计算 机 系统 的 物理 部 件 。 它 可 以 指 台式 计算 机 ， 包 括 计 算 机 呆 面 上 的 
监视 器、 键盘 、 鼠 标 和 其 他 外 部 设备 ， 最 重要 的 是 包含 所 有 内 部 组 件 的 物理 “机 箱 ”。 

机 箱 内 部 的 核心 硬件 部 件 是 中 类 处 理 器 (CPU)。CPU 是 执行 计算 的 部 件 ， 通 过 获取 程 
序 指令 和 数据 ， 并 在 数据 上 执行 指令 来 实现 计算 。 男 一 个 关键 的 内 部 组 件 是 主 存储 器 ,通常 
称 为 随机 存 取 存储 器 ( RAM)。RAM 就 是 程序 执行 时 存储 程序 指令 和 数据 的 地 方 。CPU 从 
主 存 中 读 取 指令 和 数据 ， 并 将 结果 存储 在 主 存 中 。 


在 CPU 和 主 存储 融 之 间 传 输 指 令 和 数据 的 线路 集合 通常 被 称 为 总 线 。 总 线 还 将 CPU 和 
主 存储 器 连接 到 其 他 内 部 部 件 ， 例 如 硬盘 驱动 器 和 各 种 适配器 (用 于 连接 外 部 设备 ， 例 如 监 
视 需 、 鼠 标 或 网 络 电缆 ) 。 

硬盘 是 机 箱 中 第 三 个 核心 部 件 ， 是 存放 文件 的 地 方 。 当 计算 机 关机 时 ， 主 存储 器 将 丢失 
所 有 数据 ; 然而 ,硬盘 始 终 可 以 存储 文件 ， 无 论 计算 机 是 处 于 开机 状态 还 是 关机 状态 。 另 
外 ， 硬 盘 驱 动 需 的 容量 也 比 主 存 容 量 大 得 多 。 

计算 机 系统 这 个 术语 可 以 指 一 台 计 算 机 (台式 机 、 笔 记 本 电脑 、 智 能 手机 或 者 PAD )， 
也 可 以 指 连接 到 网 络 (并 因此 彼此 互联 ) 的 计算 机 集合 。 在 后 一 种 情况 下 ， 硬 件 还 包括 网 络 
布线 和 专用 网 络 硬件 ， 例 如 路 由 器 。 

值得 强调 的 是 ， 大 多 数 开 发 人 员 不 会 直接 与 计算 机 硬件 打交道 。 如 果 程 序 员 必须 直接 针 
对 便 件 组 件 编写 指令 ， 编 写 程序 将 变 得 非常 困难 。 同 时 这 也 是 很 危险 的 ， 因 为 一 个 程序 错误 
可 以 导致 硬件 瘫痪 。 基 于 上 述 原 因 ， 在 开发 人 员 编 写 的 应 用 程序 和 硬件 之 间 存 在 一 个 接口 。 


1.2.2 ”操作 系统 


应 用 程序 不 会 直接 访问 键盘 、 计 算 机 人 硬盘 驱动 器 、 网 络 (以 及 Internet) 或 者 显示 器 。 作 
为 蔡 代 ， 应 用 程序 请 求 操作 系统 (OS) 执行 这 些 操作 。 操 作 系 统 是 计算 机 系统 中 介 于 硬件 和 
开发 人 员 编 写 的 应 用 程序 之 间 的 系统 软件 。 操 作 系 统 有 如 下 两 个 互补 功能 : 

(1 ) 操作 系统 保护 硬件 不 被 程序 或 程序 员 误 用 ; 

(2 ) 操作 系统 为 应 用 程序 提供 一 个 接口 ， 通 过 这 个 接口 ， 程 序 可 以 向 硬件 设备 请 求 
服务 。 

本 质 而 言 ， 操 作 系 统 通过 在 机 器 上 执行 的 应 用 程序 管理 对 硬件 的 访问 。 


知识 拓展 : 当今 操作 系统 的 起 源 

当今 市 场 上 主流 的 操作 系统 是 微软 的 Windows 和 UNIX 及 其 变 体 (包括 Linux 和 苹 
:和 

UNIX 操作 系统 是 20 世纪 60 年 代 后 期 和 70 年 代 初 期 由 AT&T 贝尔 实验 室 的 肯 … 汤 
兽 森 开发 研制 的 。1973 年， 由 汤普森 和 丹尼斯 . 里 奇 使 用 C 语 言 (一 个 由 里 奇 创 造 的 
程序 设计 语言 ) 重新 实现 了 UNIX。 由 于 它 是 免费 供 任 何人 使 用 的 ， 所 以 C 语 言 变 得 相 
当 流 行 ， 程 序 员 将 C 和 UNIX 移植 到 各 种 不 同 的 计算 平台 上 。 现 如 今 ， 有 若干 个 版 本 的 
UNIX， 包 括 苹 果 的 Mac OS X。 

微软 Windows 操作 系统 的 起 源 与 个 人 计算 机 的 出 现 密 不 可 分 。20 世纪 70 年代 末 ， 保 
罗 ， 艾 伦 和 比尔 ， 盖 茨 创立 了 微软 公司 。1981 年 ，IBM 研发 出 IBM 个 人 计算 机 (IBM PC) 
时 ， 微 软 为 其 提供 了 一 个 名 为 MS-DOS (微软 磁盘 操作 系统 ) 的 操作 系统 。 从 那 时 起 ， 微 
软 为 操作 系统 添加 了 一 个 图 形 界面 ， 并 将 其 重 命名 为 Windows。 最 新 版 本 是 Windows 10。 

Linux 是 20 世纪 90 年 代 初 由 林 纳 斯 ，。 本 纳 第 克 特 . 托 瓦 效 开 发 的 类 UNIX 的 操作 系 
统 。 他 的 动机 是 为 个 人 计算 机 创建 一 个 类 似 UNIX 的 操作 系统 ， 因 为 当时 UNIX 仅 限 于 
高 性 能 工作 站 和 大 型 计算 机 。 在 最 初 开发 之 后 ，Linux 成 为 一 个 基于 社区 的 开源 软件 开发 
项 目 。 这 意味 着 ， 欢 迎 任何 开发 人 员 参 与 并 帮助 进一步 开发 Linux 操作 系统 。Linux 是 成 
功 的 开源 软件 开发 项 目的 最 佳 范 例 之 一 。 
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1.2.3 ”网 络 和 网 络 协议 


许多 我 们 日 第 使 用 的 计算 机 应 用 程序 要 求 计算 机 连接 到 因特网 。 如 果 没 有 因特网 连接 ， 
就 不 能 发 送 电 子 邮 件 、 浏 览 网 页 、 收 听 互 联网 广播 ， 或 者 更 新 软件 。 要 连接 到 因特网 ， 必 须 
首先 连接 到 一 个 接 入 因特网 的 网 络 。 

计算 机 网 络 是 一 个 由 多 个 能 相互 通信 的 计算 机 组 成 的 系统 。 目 前 有 奉 干 种 不 同 的 网 络 通 
信 技 术 ， 其 中 一 些 是 无 线 技术 (例如 Wi-Fi)， 另 一 些 则 基于 网 络 电缆 (例如 以 太 网 )。 

互联 网 络 是 多 个 网 络 连 接 。 因 特 网 是 互联 网 络 的 一 个 例子 。 因 特 网 承载 着 大 量 的 数据 ， 
是 构建 万 维 网 和 电子 邮件 的 平台 。 


知识 拓展 : 因特网 的 起 源 

1969 年 10 月 29 日， 加州 大 学 洛杉矶 分 校 (UCLA) 的 一 台 计 算 机 与 斯 坦 福 大 学 斯 坦 福 
研究 所 (SRI) 的 一 全 计算机 建立 了 网 络 连接 ， 从 而 诞生 了 ARPANET， 即 当今 因特网 的 前 身 。 

使 网 络 连接 成 光 可 能 的 技术 研究 则 始 于 20 世纪 60 年代 初 。 在 那个 时 代 ， 计 算 机 变 
得 越 来 越 普及 ， 连 接 计算 机 以 实现 共享 数据 的 需求 也 日 益 凸 显 。 高 级 研究 计划 署 (ARPA， 
美国 国防 部 的 一 个 分 支 机 构 ) 决定 解决 这 个 问题 ， 于 是 为 美国 一 些 大 学 提供 资助 进行 网 络 
研究 。 今 天 所 使 用 的 许多 网 络 技术 和 网 络 概念 就 是 在 20 世纪 60 年 代 发 展 起 来 的 ， 然 后 
在 1969 年 10 月 29 日 投入 使 用 。 

20 世纪 70 年 代 开 发 的 TCP/IP 网 络 协议 族 至 今 仍 在 使 用 。 该 协议 规定 了 数据 如 何 从 
因特网 上 的 一 台 计 算 机 传输 到 另 一 全 计算机 ， 以 及 其 他 一 些 内 容 。 因 特 网 在 20 世纪 70 
年 代 和 80 年 代 迅 速 发 展 ， 但 直到 90 年 代 初 万 维 网 开发 出 来 后 ， 因 特 网 才 得 以 被 普通 大 
众 广泛 使 用 。 


1.2.4 程序 开发 语言 


计算 机 与 其 他 机 融 的 区 别 在 于 计算 机 可 以 编程 。 这 意味 着 指令 可 以 存储 在 硬盘 上 的 文件 
中 ， 然 后 装 人 主 存 并 按 需 执行 。 因 为 机 香 不 能 像 我 们 (人 类 ) 那样 处 理 歧义 ， 所 以 指令 必须 
精确 。 计 算 机 只 能 严格 按照 指令 操作 ， 并 不 能 理解 程序 员 的 意图 。 

实际 执行 的 指令 是 机 器 语言 指令 。 它 们 使 用 二 进 制 记 数 法 表示 〈 即 由 0 和 1 组 成 的 序 
列 )。 由 于 机 器 语言 指令 编写 十 分 困难 ， 计 算 机 科学 家 开发 了 程序 设计 语言 和 话 言 翻 译 需 ， 
使 开发 人 员 能 够 以 人 类 可 读 的 语言 编 与 指令， 然后 将 它们 翻译 成 机 需 语 言 。 这 样 的 语言 翻译 
右 被 称 为 汇编 程序 、 编 译 器 或 解释 器 ， 其 名 称 取决 于 对 应 的 程序 设计 语言 。 

当前 存在 许多 程序 设计 语言 。 其 中 一 些 语言 是 专门 用 于 特定 应 用 程序 的 ， 如 三 维 建 模 或 
数据 库 。 其 他 的 语言 都 是 通用 的 ,包括 C、C++、C#、Java 和 Python。 

虽然 可 以 使 用 基本 的 文本 编辑 如 编 写 程 序 ， 但 开发 人 员 通 常 使 用 集成 开发 环境 (IDE) 
来 编写 程序 。 集 成 开发 环境 可 以 提供 各 种 文 持 软件 开发 的 服务 ， 包 括 用 来 编写 和 编辑 代码 的 
编辑 器 、 语 言 翻 译名 、 创 建 二 进 制 可 执行 文件 的 目 动 化 工具 和 调试 器 。 


知识 拓展 : 计算 机 错误 (bug ) 
当 程序 的 执行 没有 达到 预期 ,例如 计算 机 死机 、 宕 机 或 产生 错误 输出 时 ,我 们 就 说 程 
序 有 一 个 bug( 即 错误 )。 排 除 错误 和 纠正 程序 的 过 程 称 为 调试 。 调 试 器 是 帮助 开发 人 员 


查找 导致 错误 的 指令 的 工具 。 

术语 “bug” 用 于 表述 系统 中 的 一 个 错误 在 计算 机 和 计算 机 科学 出 现 之 前 就 开始 使 用 
了 。 例 如 ， 早 在 19 世纪 70 年 代 ， 托 马 斯， 爱迪生 就 使 用 这 个 词 来 描述 机 械 工程 中 的 缺 
陷 和 错误 。 有 趣 的 是 ， 实 际 上 还 的 确 存 在 因为 真正 的 臭虫 (bug) 而 导致 计算 机 故障 的 案 
例 。 例 如 ， 根 据 计 算 先 驱 格雷 斯 霍 珀 在 1947 年 的 报道 ， 导 致 哈佛 大 学 Mark II 电脑 (最 
早 的 计算 机 之 一 ) 故障 的 元 凶 正 是 一 只 飞 蛾 。 


1.2.5 软件 库 


通用 程序 设计 语言 (例如 Python) 由 一 小 组 通用 指令 组 成 。 核 心 指令 集 不 包括 下 载 网 
页 、 绘 制图 像 、 播 放 音乐 、 在 文本 文档 中 查找 指定 模式 或 者 访问 数据 库 的 指令 。 这 样 设 计 的 
本 质 原因 是 ,“ 稀 跑 ” 的 语言 更 易于 被 开发 人 员 所 控制 和 管理 。 

当然 ， 也 存在 需要 访问 网 页 或 者 数据 库 的 应 用 程序 。 执 行 这 些 功能 的 指令 一 般 定义 在 与 
核心 语言 分 离 的 软件 库 中 ， 在 程序 中 必须 显 式 地 导入 相应 的 软件 库 才 能 使 用 。 有 关 如 何 使 用 
软件 库 中 定义 的 指令 的 描述 ， 则 通常 被 称 为 应 用 程序 编程 接口 (API)。 


1.3 ”Python 程序 设计 语言 


在 本 教程 中 ， 我 们 将 介绍 Python 程序 设计 语言 ， 并 使 用 Python 来 演示 计算 机 科学 的 核 
心 概念 、 学 习 程 序 设计 ， 以 及 学 习 应 用 程序 开发 。 在 本 节 中 ， 我 们 将 介绍 Python 的 一 些 背 
景 知 识 ， 以 及 如 何在 计算 机 上 设置 一 个 Python 集成 开发 环境 。 


1.3.1 Python 简 史 


Python 程序 设计 语言 是 由 衙 兰 程序 员 吉 和 多: 范 罗 办 姆 于 20 世纪 80 年 代 末 在 CWI ( 国 
家 数学 和 计算 机 科学 人 研究 院 ， 位 于 人 衙 兰 的 阿姆斯特丹 ) 工作 时 开发 的 。 该 语言 的 命名 不 是 
取 自 巨 蟒 (Python)， 而 是 以 英国 广播 公司 喜剧 系列 《 巨 虹 的 飞行 马戏 团 》( Monty Python’s 
Flying Circus) 命名 ， 吉 多 … 范 罗 苏 姆 是 该 剧 的 粉丝 。 与 Linux 操作 系统 一 样 ，Python 最 终 
成 为 一 个 开源 软件 开发 项 目 。 然 而 ， 吉 多 … 范 罗 办 姆 在 决定 语言 的 演化 过 程 中 依然 处 于 主导 
地 位 。 为 了 巩固 这 个 角色 ， 他 被 Python 界 授予 了 “仁慈 的 独裁 者 ”的 称号 。 

Python 是 一 种 通用 语言 ， 专 门 设计 用 来 增强 程序 的 可 读 性 。Python 也 有 丰富 的 库 ， 从 
而 使 得 可 以 通过 相对 简单 的 代码 构建 复杂 的 应 用 程序 。 基 于 上 述 原 因 ，Python 已 经 成 为 一 种 
流行 的 应 用 程序 开发 语言 ， 同 时 也 是 首选 的 “入 门 ” 编 程 语言 。 





注意 事项 : Python 2 还 是 Python 3 

目前 使 用 的 Python 有 两 个 主要 版 本 。Python 2 最 初 于 2000 年 发 布 ， 最 新 版 本 是 2.7。 
Python 3 是 一 种 新 版 本 ， 它 弥补 了 Python 语言 早期 开发 中 一 些 不 太 理 想 的 设计 决策 。 不 
幸 的 是 ，Python 3 并 不 向 后 兼容 Python 2。 这 意味 着 使 用 Python 2 编写 的 程序 ， 通常 无 法 
被 Python 3 解释 器 正确 地 执行 。 

在 这 本 教科 书 中 ， 我 们 选择 使 用 Python 3， 因 为 它 的 设计 更 加 一 致 。 要 了 解 更 多 关于 
这 两 个 版 本 之 间 的 差异 ， 请 参见 : 

http://wiki.python.org/moin/Python2orpython3 


太 食 机 姑 学 导论 7 


1.3.2 ”构建 Python 开发 环境 


如 果 你 的 计算 机 上 还 没有 安装 Python 开发 工具 ， 则 需要 先 下 载 一 个 Python 集成 开发 环 
境 。Python 集成 开发 环境 的 官方 列表 位 于 如 下 网 址 : 

http://wiki.python.org/moin/IntegratedDevelopmentEnvironments 

我 们 使 用 标准 的 Python 开发 工具 包 (其 中 包括 IDLE 集成 开发 环境 ) 来 说 明 IDE 安装 过 
程 。 你 可 以 从 如 下 网 址 下 载 工 具 包 (免费 ): 

https/ /python.org/download/ 

该 网 页 中 包括 了 适用 于 所 有 主流 操作 系统 的 安 容 程序 列表 。 读 者 可 以 针对 自己 的 计算 机 
系统 选择 适当 的 安装 程序 ， 下 载 并 完成 安装 。 

为 了 开启 使 用 Python 之 旅 ， 用 户 需 要 打开 一 个 Python 交互 式 命令 (interactive shell) 窗 
口 。Python 集成 开发 环境 中 包含 的 IDLE 交互 式 命令 窗口 如 图 1-1 所 示 。 


0 ry Python Shedl 





图 1-1 Python 的 IDLE 集成 开发 环境 。Python 的 标准 实现 中 包 洛 了 IDLE 集成 开发 环境 。 图 
1-1 中 显示 的 是 IDLE 交互 式 命 令 窗 口 。 在 提示 符 >>> 下 ， 可 以 键 人 单个 Python 指令 
按 下 【 Enter/Return 】 键 时 ，Python 解释 天 执行 指 令 


交互 式 命 令 窗 口 等 竺 用 户 键 人 Python 指令 。 当 用 户 键 入 指令 “print('Hello 
wor1d')”， 并 按 下 键盘 上 的 【 Enter/Return 】 键 时 ， 将 打印 输出 问候 语 : Hello world。 运 
行 过 程 和 运 z 行 结果 如 下 所 示 ， 


Python S21 (v.21aclf7eSc0S510, Jaul 9 2011, 014*%03:53) 

[GCC 4.2.1 ed Ince. build 5666) (dot 3)] on darvin 

Type Oe credits" or "Jicanse()" for more 1nformation. 
户 六 六 print('Hello ， World' 

Hello world 


交互 式 命 令 窗 口 用 来 执行 单个 Python 指令 ,例如 “print('Hello world')”。 
个 程序 通常 由 多 条 指令 组 成 ， 这 些 指 令 必 须 在 执行 前 存储 在 文件 中 
1.4 计算 思维 


本 市 将 针对 目 动 化 Web 搜索 任务 问题 阐述 软件 开发 过 程 ， 并 介绍 软件 开发 相关 术语 。 
为 了 对 任务 的 相关 方面 进行 建 模 ， 并 将 任务 描述 为 一 种 算法 ， 我 们 必须 从 “计算 ”的 角度 来 


理解 任务 。 计 算 思 维 是 一 个 术语 ， 用 于 描述 日 然 或 人 工 过 程 或 者 任务 被 理解 和 描述 为 计算 过 
程 的 智能 方法 。 作 为 计算 机 科学 家 ， 这 个 可 能 是 其 训练 中 需要 竺 握 的 最 重要 的 技能 。 


1.4.1 一 个 示例 问题 


假如 我 们 打算 从 喜欢 的 在 线 购 物 网 站 上 购买 12 本 获奖 小 说 。 但 是 并 不 打算 原价 购买 ， 
我 们 宁愿 等 待 购 买 打折 书 。 更 确切 地 说 ， 我 们 对 每 本 书 都 有 一 个 目标 心理 价位 ， 只 有 当 它 的 
销售 价格 低 于 目标 价格 时 ， 才 会 买 这 本 书 。 因 此 ， 每 隔 几 天 ， 我 们 会 访问 购物 清单 上 每 本 书 
的 产品 网 页 ， 并 检查 每 本 书 的 价格 是 否 已 降 至 目标 价格 之 下 。 

作为 计算 机 科学 家 ， 我 们 不 应 该 满足 于 一 个 网 页 接 痢 一 个 网 页 地 手动 访问 。 我 们 将 目 动 
化 搜索 过 程 。 换 言 之 ， 我 们 将 开发 一 个 应 用 程序 ， 让 这 个 应 用 程序 访问 我 们 列表 中 的 图 书 所 
在 网 页 ， 并 找到 价格 低 于 目标 价格 的 图 书 。 为 了 实现 这 个 目标 ， 我 们 首先 需要 描述 计算 思维 
中 的 搜索 过 程 。 


1.4.2 ”抽象 和 建 模 

让 我 们 从 简化 问题 陈述 开始 。 作 为 问题 上 下 文 的 “真实 世界 ”包含 一 些 并 不 真正 相关 的 
言 息 。 例 如 ,产品 是 不 是 书 并 不 重要 ， 更 不 用 说 具体 到 获奖 小 说 了 。 搜 索 过 程 的 自动 化 同样 
适用 于 产品 是 登山 鞋 或 者 时 尚 鞋 的 情况 。 

同样 ， 购 物 清单 包含 12 种 产品 也 不 重要 。 关 键 在 于 需要 有 一 个 列表 (产品 列表 ): 我 
们 的 应 用 程序 应 该 能 够 处 理 12、13、11 个 或 者 任意 数量 的 产品 列表 。 忽 略 “12 本 小 说 ” 
的 细节 的 额外 优点 在 于 ， 我们 最 终 开 发 的 应 用 程序 将 在 任意 长 度 的 任意 产品 列表 中 重复 
使 用 。 

那么 ， 这 些 问题 的 相关 方面 是 什么 呢 ? 其 一 ， 每 个 产品 都 有 一 个 相关 的 网 页 ， 包 含 该 商 
品 的 价格 ; 其 二 ， 对 于 每 个 产品 ， 我 们 都 有 一 个 目标 价格 ; 最 后 ，Web 本 和 喘 也 是 一 个 相关 的 
方面 。 我 们 可 以 总 结 一 下 相关 信息 ， 罗 列 如 下 : 

a. Web 

b. 包含 产品 网 页 地 址 的 列表 

c. 包含 目标 价格 的 列表 

第 一 个 列表 称 之 为 地 址 (Adadresses )， 第 二 个 列表 称 之 为 目标 (Targets ) 。 

我 们 需要 更 精确 地 描述 列表 ， 因 为 不 清楚 地 址 列表 Addresses 中 的 网 页 地 址 如 何 对 应 
于 目标 列表 Targets 中 的 目标 价格 。 

我 们 通过 对 产品 按 0、1 、2、3…… 进 行 编号 来 确定 顺序 (计算 机 科学 家 从 0 开始 计数 )， 
然后 对 网 页 地 址 和 目标 价格 排序 ， 保 证 产品 的 网 页 地 址 和 目标 价格 在 各 自 的 列表 中 处 于 同一 
位 置 。 如 图 1-2 所 示 。 


产品 0 | 2 


Addresses || 产品 0 网 页 地 址 上 || 产品 1 网 页 地 址 |||| 产品 2 网 页 地 址 || … 
Targets | [产品 0 目标 价格 || | 产品 1 目标 价格 ||| [产品 2 目标 价格 || …. 


图 1-2 网 页 地 址 和 目标 价格 列表 。 产 品 0 的 网 页 地 址 和 目标 价格 在 各 自 的 列表 中 的 第 一 个 位 
置 ， 对 于 产品 1， 它 们 都 在 第 二 个 位 置 ; 对 于 产品 2， 它 们 在 第 三 个 位 置 ， 以 此 类 推 


计算 机 姑 学 必 论 。 9 


提取 问题 相关 方面 的 过 程 称 为 抽象 。 这 是 一 个 必要 的 步 又， 其 结果 是 问题 可 以 用 逻辑 和 
数学 的 语言 来 精确 描述 。 抽 和 象 的 结果 是 一 个 模型 ， 它 代表 了 问题 的 所 有 相关 方面 。 


1.4.3 ”算法 


我 们 要 开发 的 搜索 应 序 应 该 “依次 ”“ 访 问 ” 产 品 网 页 : 对 于 每 一 个 产品 , “检查 ” 
价格 是 否 已 乡 epee 里 然 上 述 天 于 这 个 应 用 程序 应 该 如 何 工作 的 描述 对 我 们 
来 说 可 能 是 清楚 的 ， 但 它 不 够 精确 。 例 如 ,， “访问 “依次 ”和 “检查 ”， rn 

当 我 们 “访问 ”一 个 网 页 时 ,实际 上 是 下 载 该 网 页 并 在 浏览 絮 中 显示 它 (或 阅读 
当 我 们 说 要 “依次 ”访问 奢 干 网 页 时 ， 需 要 清楚 地 指出 每 个 网 页 都 会 被 仅仅 访问 一 次 ， | 
该 清楚 地 指定 访问 页 面 的 顺序 。 最 后 ， 为 了 “检查 ”价格 是 否 已 经 降低 到 期 望 值 ， 我 们 需要 
自 先 在 网 页 中 查找 到 价格 。 

为 了 便于 最 终 将 搜索 过 程 实现 为 一 个 计算 机 程序 ， 我 们 需要 使 用 更 精确 的 分 步 指令 ( 换 
言 之 , 算法 ) 来 描述 搜索 过 程 。 该 算法 应 六 该 包括 所 有 步 又 的 明确 描述 : # 定 输 入 ， 执 行 操 作 ， 
最 后 生成 预期 的 输出 。 

算法 的 设计 通常 以 明确 指定 输入 数据 ( 即 开 始 的 信息 ) 和 输出 数据 ( 即 预 期 获得 的 信息 
开始 : 

输入 : 被 称 为 Addqresses 的 网 页 地 址 的 有 序列 表 和 被 称 为 azgets 的 目标 价格 的 有 
序列 表 ， 二 者 大 小 相同 。 

输出 :〈 在 屏幕 上 显示 ) 价格 低 于 目标 价格 的 网 页 地 址 。 

算法 描述 如 下 : 

”把 Addresses 列表 中 的 产品 数量 赋值 给 变量 N。 

针对 每 二 个 产品 工 = 0，17 RN-1L， 执 行 如 下 步 桶 : 
把 Addresses 列表 中 第 工 个 产品 的 网 址 赋值 给 变量 ADDR 


下 载 网 址 为 ADDR 的 网 页 ， 然 后 
把 网 页 的 内 容 赋值 给 变量 PAGE 


在 PAGE 中 查找 产品 工 的 当前 价格 ， 然 后 
把 当前 价格 赋值 给 变量 CURR 


把 Targets 列表 中 的 产品 工 的 目标 价格 赋值 给 变量 TARG 


If CURR < TARG: 
打印 ADDR 
该 算法 的 描述 并 不 是 真实 的 程序 代码 ， 不 能 在 计算 机 上 执行 。 它 只 是 关于 完成 一 个 任务 
做 什么 的 鸽 单 的 精确 描述 ， 通 和 常 被 称 为 伪 人 代码。 算法 也 可 以 用 实际 的 可 执行 代码 来 描 
人 在 本 书 的 其 余部 分 ， 我 们 将 使 用 Python 程序 来 描述 我 们 的 算法 。 


1.4.4 数据 类 型 


述 搜索 算法 的 描述 包括 对 各 种 数据 的 引用 : 
a. N， 产 品 的 数量 
b. ADDR, 一 个 网 页 的 地 址 


c. PAGE, 一 个 网 页 的 内 容 

d. CURR 和 TARG， 当 前 价格 和 目标 价格 

e. Addresses 询 表 和 Targets 列表 

名 称 W_、I、RDDR、PRAGE 、CURR 和 TARG 称 为 变量 ， 这 和 代数 中 的 变量 一 样 。 名 称 
Addresses 和 Targets 也 是 变量 。 变 量 的 作用 是 存储 值 ， 以 便 后 续 使 用 。 例 如 ， 上 述 算 
法 中 ， 对 于 变量 ADDR， 在 算法 的 第 $ 行 被 赋值 ， 在 算法 的 第 16 行 中 打印 输出 。 

让 我 们 进一步 讨论 这 些 数据 可 存储 的 值 的 类 型 。 产 品 的 数量 N 是非 负 整数 值 。 当 前 价 
格 CURR 和 目标 价格 TARG 是 正 数 ， 可 以 使 用 小 数 点 符号 。 我 们 将 其 描述 为 正 的 非 整 数 的 数 
值 。 网 页 地 址 ADDR 的 “ 值 ” 和 该 网 页 内 容 的 “ 值 ” 叉 是 什么 呢 ?” 两 者 均 可 以 描述 为 学 和 从 订 
列 (忽略 非 文本 内 容 )。 最 后 是 两 个 列表 。 地 址 列表 Addresses 是 一 个 有 序 的 地 址 序列 ( 字 
符 序 列 )， 而 目标 价格 列表 Targets 则 是 一 个 有 序 的 价格 序列 (数值 )。 

数据 类 型 是 指数 据 包 括 的 值 范 围 〈 例 如 整数 、 非 整数 、 字 符 序 列 或 其 他 值 列 表 )， 以 及 
可 以 在 数据 上 执行 的 操作 。 在 上 述 算法 中 ， 针 对 数据 进行 了 如 下 操作 : 

a. 比较 数值 CURR 和 TARG， 

b. 在 列表 Addresses 中 查找 产品 工 的 网 址 。 

c. 在 网 页 内 容 中 查找 产品 价格 。 

d. 基于 整数 N 创建 了 一 个 序列 0,1,2,…,N-1。 

在 a 操 作 中 ， 我 们 假设 数值 类 型 可 以 进行 比较 。 在 b 操 作 中 ， 我 们 假设 可 以 从 
Addresses 列表 中 检索 产品 工 的 网 址 。 在 c 操作 中 ， 我 们 假设 可 以 搜索 一 系列 字符 ， 并 查 
找 类 似 价 格 的 信息 。 在 d 操作 中 ， 我 们 假设 可 以 创建 一 个 从 0 到 一 个 整数 (但 不 包含 该 整数 ) 
的 序列 。 

这 里 我 们 强调 的 是 : 一 个 算法 由 操作 数据 的 指令 组 成 ， 而 数据 如 何 操 作 则 取决 于 数据 
类 型 。 以 上 述 d 操作 为 例 : 虽然 这 种 操作 针对 整数 数据 类 型 合情合理 ， 但 针对 其 他 数据 ( 例 
如 ， 网 页 地 址 数据 ADDR) 则 完全 没有 任何 意义 。 因 此 整数 数据 类 型 文 持 创 建 序列 的 操作 ， 
而 “字符 序列 ”数据 类 型 则 不 文 持 。 

因此 ， 如 果 站 在 “计算 思维 ”的 角度 上 思考 问题 ， 则 需要 真正 了 解 我 们 可 以 使 用 哪些 类 
型 的 数据 ， 以 及 针对 这 些 数据 可 以 执行 什么 操作 。 因 为 我 们 将 在 Python 编程 的 上 下 文中 进 
行 “ 计 算 思 维 ”， 所 以 我 们 需要 了 解 Python 文 持 的 数据 类 型 及 其 操作 。 因 此 ， 我 们 的 首要 任 
务 是 学 习 Python 的 核心 数据 类 型 ， 特 别 是 这 些 数据 类 型 支持 的 不 同 操 作 ， 这 些 是 第 2 章 的 


1.4.5 ”赋值 语句 和 执行 控制 结构 

除了 不 同类 型 的 数据 外 ， 上 述 设 计 的 产品 搜索 算法 使 用 了 不 同 的 指令 。 算 法 中 的 右 十 指 
令 将 一 个 值 赋 给 变量 : 

a. 第 1 行 ， 将 一 个 值 赋 给 变量 N。 

b. 第 5 行 ， 将 一 个 值 赋 给 变量 ADDR。 

c. 第 8 行 ， 将 一 个 值 赋 给 变量 PAGE。 

d. 第 11 行 ,将 一 个 值 赋 给 变量 CURR。 

e. 第 13 行将 一 个 值 赋 给 变量 TARG。 

虽然 赋 给 变量 的 值 是 不 同 的 类 型 ， 但 是 使 用 相同 的 指令 进行 赋值 。 这 种 指令 称 为 赋值 
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语句。 z 
第 15 行使 用 了 一 条 不 同 的 指令 。 这 个 指令 比较 当前 价格 CURR 与 目标 价格 TARG， 当 
( 且 仅 当 ) CURR 的 值 小 于 TARG 的 值 ， 第 16 行 的 语句 才 被 执行 (输出 ADDR 的 值 )。 第 15 行 
中 的 下 指令 是 一 种 称 为 条 件 控制 结构 的 指令 。 

第 3 行 描 述 了 男 一 种 指令 。 这 个 指令 将 针对 工 的 每 一 个 值 ， 重 复 执 行 第 5 行 到 第 16 行 
中 的 语句 。 因 此 ， 当 工 等 于 0，1，2,，… 时 , 语句 5 到 16 将 被 重复 执行 。 针 对 工 等 于 N-1， 
执行 了 语句 5 到 16 之 后 ， 第 3 行 中 的 指令 就 执行 完毕 。 这 种 指令 称 为 迭代 控制 结构 。 迁 代 
这 个 词 的 意思 是 “重复 一 个 过 程 的 动作 ”， 在 上 述 算法 中 ， 重 复 执 行 的 过 程 是 指 重复 执行 第 
5 行 到 第 16 行 中 的 语句 。 

条 件 控制 结构 和 壕 代 控制 结构 统称 为 执行 控制 结构 。 执 行 控制 结构 用 于 控制 程序 中 语句 
的 执行 流 。 换 言 之 ， 它 们 决定 语句 的 执行 顺序 ， 在 什么 条 件 下 执行 ， 以 及 执行 多 少 次 。 执 行 
控制 结构 与 赋值 语句 类 似 ， 都 是 描述 问题 的 计算 解决 方案 和 算法 设计 的 基本 构造 。 我 们 在 第 
2 草 中 介绍 Python 的 核心 数据 类 型 之 后 ， 将 在 第 3 前 中 介绍 Python 的 执行 控制 结构 。 


1.4.6 ”本 章 小 结 


本 章 介绍 了 计算 机 科学 的 领域 、 计 算 机 科学 家 和 开发 人 员 所 做 的 工作 ， 以 及 计算 机 科学 
家 和 开发 人 员 使 用 的 工具 。 

计算 机 科学 研究 的 内 容 ， 一 方面 是 信息 和 计算 的 理论 基础 ， 为 一 方面 是 在 计算 机 系统 上 
实现 应 用 的 实践 技术 。 计 算 机 应 用 程序 开发 人 员 在 应 用 程序 开发 的 上 下 文中 使 用 计算 机 科学 
的 概念 和 技术 。 计 算 机 应 用 程序 开发 人 员 构 造 抽象 的 表示 以 建 模特 定 的 其 实 或 虚拟 的 环境 ， 
创建 算法 以 操作 模型 中 的 数据 ， 然 后 将 算法 实现 为 可 以 在 计算 机 系统 上 执行 的 程序 。 

汁 算 机 科学 工具 包括 抽象 的 数学 和 逻辑 工具 以 及 有 具体 的 计算 机 系统 工具 。 计 算 机 系统 工 
具 包 括 硬件 和 软件 。 特 别 是 它们 包括 程序 设计 语言 和 程序 设计 语言 工具 ， 开 发 人 员 最 终 通过 
这 些 工 具 控 制 不 同 的 系统 组 件 。 

计算 机 科学 家 使 用 的 抽象 工具 是 基于 惕 辑 和 数学 的 计算 思维 技能 ， 它 们 在 从 抽象 和 计算 
的 角度 描述 问题 、 任 务 和 过 程 时 是 必要 的 工具 。 为 了 掌握 该 技能 ， 我 们 需要 擎 握 一 种 抽象 
和 计算 语言 。 当 然 ， 最 好 的 方法 是 掌握 一 门 程序 设计 语言 。 实 际 上 ， 程 序 设 计 语 言 是 连接 系 
统 和 开发 人 员 抽 和 象 工具 的 黏合 剂 。 因 此 ， 和 擎 握 程序 设计 语言 是 计算 机 科学 家 必须 具有 的 核心 
技能 。 


第 2 音 | 


Introduction to Computing Using Python: An Application Development Focus, Second Edition 


Python 数据 类 型 





本 章 将 介绍 一 个 非常 小 的 Python 子 集 。 虽 然 内 容 不 多 ， 但 所 涉及 的 范围 足够 着 手 解 决 
一 些 有 趣 的 问题 。 在 接 下 来 的 草 节 中 ， 我 们 将 陆续 展开 详细 的 前 述 。 我 们 首先 使 用 Python 
作为 计算 器 ， 用 于 计算 代数 表达 式 的 值 。 然 后 ， 引 入 变量 作为 一 种 “ 记 住 ”这 种 计算 结果 的 
手段 。 最 后 ， 我 们 将 展示 Python 是 如 何 处 理 数 值 以 外 的 值 : 逻辑 值 True 和 False、 文 本 值 
和 值 列表 。 

在 介绍 了 Python 支持 的 核心 数据 类 型 之 后 ， 我 们 将 进一步 精确 地 定义 有 关 数 据 类 型 和 
存储 给 定 类 型 值 的 对 象 的 概念 。 数 据 一旦 存储 在 对 象 中 ， 我 们 就 可 以 忽略 数据 是 如 何在 计算 
机 中 表示 和 存储 的 ， 并 且 只 需要 使 用 对 象 类 型 显 式 提供 的 抽象 但 熟悉 的 属性 来 工作 。 抽 象 出 
重要 属性 的 思想 是 计算 机 科学 中 的 一 个 核心 理念 ， 后 续 章节 我 们 将 会 多 次 讨论 涉及 ， 

除了 核心 的 内 置 数据 类 型 外 ，Python 还 包括 大 量 的 附加 类 型 库 ， 它 们 被 组 织 成 模块 。 我 
们 使 用 两 个 数学 模块 来 说 明 Python 标准 库 的 用 法 。 


2.1 表达 式 、 变 量 和 赋值 语句 

让 我 们 从 熟悉 的 东西 开始 。 我 们 从 简单 的 代数 表达 式 开 始 ， 使 用 Python 集成 开发 环境 
交互 式 命令 行 作 为 计算 器 ， 来 对 Python 表达 式 求 值 。 我 们 的 目标 是 说 明 Python 是 如 何 直 观 
并 且 通 常 按照 预期 的 方式 运行 。 


2.1.1 代数 表达 式 和 函数 


在 Python 交互 式 命 令 提 示 符 >>> 下 ， 键 和 人 一 个 代数 表达 式 ， 例 如 “3 + 7”， 然 后 按键 
盘 上 【 Enter 】 键 ， 查 看 该 表达 式 的 求 值 结果 


>>> 3 和 7 
10 


让 我 们 尝试 使 用 不 同 代数 运算 和 (或 者 称 操作 和 从 ) 的 表达 式 : 


3 总 





在 前 两 个 表达 式 中 ， 整 数 进 行 加 或 者 乘 ， 结 果 是 一 个 整数 ， 这 符合 预期 。 在 第 三 个 表达 
式 中 ， 一 个 整数 除 以 男 一 个 整数 ， 绪 果 用 小 数 点 表示 。 这 是 因为 当 一 个 整数 除 以 力 一 个 整数 
时 ， 结 果 不 一 定 是 整数 。Python 中 的 运算 规则 是 返回 一 个 小 数 点 和 小 数 部 分 (即使 结果 是 
整数 )。 在 最 后 一 个 表达 式 中 说 明了 这 一 点 ， 其 中 整数 4 除 以 整数 2， 绪 末 显 示 为 2.0 而 不 
是 2。 


没有 小 数 点 的 值 称 为 整数 类 型 ， 或 者 向 称 整 数 ( int)。 包 括 小 数 点 和 小 数 部 分 的 值 称 为 
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浮 点 型 类 型 ， 或 者 简称 浮 点 数 (£1oat)。 让 我 们 继续 使 用 这 两 种 类 型 的 值 来 对 表达 式 求 值 : 
> 有 本 林 攻 
> (3 十 1) 本 3 
2 
> dB21 / 3 和 10 
11.440333333333333 
> 24 二) 
0.3323846153846154 


如 果 在 这 些 表达 式 中 使 用 了 多 个 操作 符 ， 则 会 出 现 一 个 问题 : 表达 式 运 算 应 该 以 什么 顺 
序 进行 求 值 ? 标准 代数 的 优先 级 规则 适用 于 Python : 乘法 和 除法 的 优先 级 高 于 加 法 和 减法 。 
正如 在 代数 中 ， 当 我 们 想 要 显 式 指 定 操 作 应 该 发 生 的 顺序 时 ， 可 以 使 用 括号 。 如 果 没 有 其 他 
的 规则 ， 则 表达 式 将 使 用 从 左 到 右 的 求 值 规 则 进行 运算 。 从 左 到 石 的 沁 伸 规则 适用 于 如 下 的 
表达 式 ， 其 中 加 法 运算 在 减法 运算 之 后 执行 : 

一 二 

2 


迄今 为 止 ， 我 们 求 值 的 所 有 表达 式 都 是 简单 的 代数 表达 式 ， 包 括 数值 ( 整 型 int 或 者 浮 
点 型 £10at )、 代 数 运 算 符 (例如 ，+、-、/ 和 *) 和 括号 。 

当 按 【 Enter 】 键 时 ，Python 解释 需 将 读 取 表达 式 并 按照 预期 的 方式 对 其 进行 求 仁 。 下 
面 是 男 外 一 个 稍微 不 寻常 的 代数 表达 式 的 例子 : 

SS 3 

3 


Python 将 表达 式 3 求 值 为 3。 

两 种 类 型 的 数值 (int 和 float) 具有 一 些 不 同 的 属性 。 例 如 ， 当 两 个 int 值 相 加 、 
相 减 或 者 相 乘 时 ， 结 果 是 一 个 int 值 。 但 是 ， 如 果 表 达 式 中 至 少 有 一 个 float 值 时 ， 则 
结果 总 是 一 个 float 值 。 注 意 ， 当 两 个 int 值 (例如 ,4 和 2) 相 除 时 ， 结 果 也 会 得 到 
fl1oat 值 。 

其 他 几 个 代数 运算 符 也 经 常 被 使 用 。 要 计算 2 ， 则 需要 使 用 舌 运 算 符 **: 

>>> 2**3 

8 


>>> 2**4 
16 


所 以 Python 表达 式 x**y 用 来 计算 x。 

为 了 得 到 两 个 整数 值 整除 的 商 和 余数 ， 可 以 使 用 运算 符 // 和 &%。 表 达 式 a//b 中 运算 
符 // 返回 a 除 以 b 时 得 到 的 商 (整数 值 ， 也 即 运算 符 // 表示 整除 )。 表 达 式 a%b 中 运算 
御 % 返回 a 除 以 b 后 得 到 的 余数 。 例 如 : 


Sy Ba A 3 
4 
> 1 
2 


在 第 一 个 表达 式 中 ，14//3 运算 结果 为 4， 因 为 14 中 包括 4 个 3。 在 第 二 个 表达 式 中 ，14% 
3 运算 结果 为 2， 因 为 14 除 以 3， 所 得 到 的 余数 为 2。 

Python 还 支持 在 代数 课 上 使 用 的 数学 吨 数 。 回 想 一 下 ， 代 数 中 使 用 如 下 书写 方法 来 定 
义 晒 数 (): 





f(x) = 


其 中 ，f() 包含 一 个 参数 ， 表 示 为 x， 返 回 一 个 值 ， 此 处 为 x+1。 例 如 ， 当 输入 值 为 3 
时 ， 可 以 使 用 书写 方法 E(3) 来 调用 此 男 数 ， 其 求 值 结果 为 4。 
Python 盟 数 与 此 类 似 。 例 如 ，Python 遇 数 abs() 可 以 用 于 计算 一 个 数 的 绝对 值 : 


>>> abs(-4) 

4 

>>> abs (4) 

4 

>>> abs(-3.2) 
过 


Python 中 还 提供 了 其 他 的 一 些 困 数 ， 包 括 min() 和 max()， 分 别 返 回 奉 干 输入 值 的 最 
小 值 或 者 最 大 值 。 例 如 : 


>>> min(6, -2) 

-2 

3 a, =2) 

6 

>>> min(2, -4, 6, -2) 
-4 

3>> maT(L2, 26.5. 35) 
26 .5 


根据 如 下 语句 编写 Python 代数 表达 式 : 

(a) 前 5 个 正 整 数 的 和 。 

(b) Sara (23 岁 )、Mark (19 岁 ) 和 Fatima (31 岁 ) 的 平均 年 龄 。 
[e403 中 地 茹 多 实 本 了 了 3 

(d) 403 除 以 73 的 余数 。 

(6) 2 的 10 闫 廊 6 

(f) Sara 的 身高 (54 英寸 ) 和 Mark 的 身高 (57 英寸 ) 之 差 的 绝对 值 
(g) 如 下 价格 中 最 低 价 格 : $34.99、$29.95 和 $31.50。 


2.1.2 布尔 表达 式 和 运算 符 

代数 表达 式 的 运算 结果 总 是 为 一 个 数值 ， 不 管 数据 类 型 是 int 或 者 float， 还 是 
Python 文 持 的 其 他 数据 类 型 。 在 代数 课 兴 中， 除了 代数 表达 式 外 ， 还 有 其 他 稼 用 的 运算 表 
达 式 。 例 如 ， 表 达 式 2 < 3 的 运算 结果 并 不 是 一 个 数值 ， 其 运算 结果 要 么 是 True 要 么 是 
False (本 例 结果 为 True)。Python 也 可 以 对 此 类 称 为 布尔 表达 式 的 表达 式 进 行 求 值 。 布 
尔 表 达 式 是 运算 结果 为 以 下 两 个 布尔 值 之 一 的 表达 式 : True 和 False。 这 两 个 值 称 为 布尔 
类 型 ， 和 Python 语言 中 的 int 和 float 数据 类 型 类 似 ， 用 bool 表示 。 

比较 运算 符 (例如 ，< 或 >) 是 布尔 表达 式 中 笛 用 的 运算 符 。 例 如 : 


人 

True 

2 

False 

> = 下 
True 
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最 后 一 个 表达 式 说 明 ， 比 较 运 算 符 两 端的 算术 表达 式 先 求 值 ， 然 后 进行 比较 运算 。 本 章 
后 续 章 节 将 阐述 ， 算 术 表 达 式 的 运算 优先 级 高 于 比较 运算 符 的 优先 级 。 例 如 , 5 - 1 > 
2 + 1， 首 先 对 运算 符 - 和 + 求 什 ， 然 后 对 绪 果 人 进行 比较 。 

如 果 要 检查 两 个 值 是 否 相 等 ， 可 以 使 用 相等 运算 符 ==。 注 意 ， 相 等 运算 符 包 括 两 个 等 
号 =， 而 不 是 一 个 。 例 如 : 


>>> 3 == 3 
True 
>>> 3+ 5 ==4+4 
True 
>>2> 3 == B =. 3 
False 
其 他 的 逻辑 比较 运算 符 包 括 : 
>>> 3 <= 4 
True 
33% 3 SE 
False 
>>> 3 != 4 
True 


布尔 表达 式 3 <= 4 使 用 <= 运 算 符 来 测试 左 侧 的 表达 式 (3 ) 是 否 小 于 或 者 等 于 右 侧 的 表 
达 式 (4)。 因 此 ,该 布尔 表达 式 运算 结果 为 True。 运 算 符 >= 用 来 测试 左 侧 操 作 数 是 否 大 
于 或 者 等 于 右 侧 的 操作 数 。 表 达 式 3 != 4 使 用 不 相等 运算 符 != 来 测试 左 侧 的 表达 式 和 右 
侧 的 表达 式 是 否 不 相等 。 


根据 如 下 语句 编写 Python 布尔 表达 式 并 求 值 : 
(a) 2 和 2 之 和 小 于 4。 

(bj 7 7 3 的 但 村 于 工 二 1。 

(c) 3 的 平方 和 4 的 平方 之 和 等 于 25。 

和 1 

(e) 1387 可 以 被 19 整除 。 

(f) 31 是 偶数 。( 提 示 : 31 除 以 2 的 余数 是 多 少 ? ) 

(g) $34.99、$29.95 和 $31.50 的 最 低 价格 小 于 $30.00。 


正如 代数 表达 式 可 以 组 合成 复杂 的 代数 表达 式 ， 布 尔 表 达 式 也 可 以 使 用 布尔 运算 符 
(and、or 和 not) 组 合成 复杂 的 布尔 表达 式 。and 运算 符 应 用 于 两 个 布尔 表达 式 时 ， 当 两 
个 表达 式 的 运算 结果 均 为 True 时 ， 则 结果 为 True ; 如 果 任 一 表达 式 运 算 结果 为 False， 
则 结果 为 False。 例 如 : 

>> 3 anda>5 

False 


>>> 2 < 3 and. True 
True 


上 述 两 个 表达 式 表 明 ， 比 较 运 算 符 的 运算 优先 于 布尔 运算 符 。 这 是 因为 比较 运算 符 的 优先 级 
高 于 布尔 运算 符 ， 有 关 优 先 级 ， 本 章 稍 后 将 进一步 阐述 。 

or 运算 和 从 应 用 于 两 个 布尔 表达 式 时 ， 当 两 个 表达 式 的 运算 结果 均 为 False 时 ， 则 结果 
为 False; 如 果 任 一 表达 式 运 算 结 果 为 True， 则 结果 为 True: 


16 淄 2 脏 


> > 

True 

| 

False 

not 运算 符 是 一 元 布尔 运算 符 (又 称 为 单 目 运算 符 )， 这 意味 着 它 应 用 于 单个 布尔 表达 
式 (相对 于 二 元 (或 称 为 双 目 ) 布尔 运算 符 and 和 or)。 当 表达 式 为 真 时 ， 其 运算 结果 为 
False; 当 表 达 式 为 假 时 ， 运 算 结 果 为 True。 

> Tot (3 < 4) 

False 


知识 拓展 : 乔治 : 布尔 和 布尔 代数 
乔治 .布尔 (1815 一 1864 ) 发 明了 布尔 代数 。 布 尔 代 数 是 构建 计算 机 硬件 的 数字 次 
辑 和 程序 设计 语言 的 形式 化 规范 的 基石 。 
布尔 代数 是 关于 值 true 和 false 的 代数 。 布 尔 代数 包括 运算 符 and、or 和 not， 可 
以 用 于 创建 布尔 表达 式 , 布尔 表达 式 的 运算 结果 为 true 或 者 false。 如 下 所 示 的 真 值 表 定 
义 了 这 些 操 作 符 的 运算 规则 。 


p q pandq p q porq p notp 
true true true true true true true false 
true false | false true false | true false | true 
false | true false false | true true 
false | false | false false | false | false 





2.1.3 ”变量 和 赋值 语句 


让 我 们 进一步 深入 研究 我 们 的 代数 主题 。 正 如 我 们 从 代数 中 所 知道 的 ， 将 名 称 分 配给 值 
是 非常 有 用 的 ， 这 些 名 称 被 称 为 变量 。 例 如 ， 在 代数 问题 中 ， 可 以 按 如 下 方式 把 值 3 赋值 给 
变量 x: x = 3。 变 量 x 可 以 认为 是 值 3 的 名 称 ， 并 且 随 后 可 以 检索 到 。 为 了 检索 它 ， 可 以 在 
表达 式 中 对 x 求 值 。 

Python 语言 也 可 以 实现 同样 的 操作 。 一 个 值 可 以 赋 给 一 个 变量 ， 


> 有 于 音 


语句 x = 4 称 为 狠 角 博 句 。 一 条 赋值 语句 的 一 般 语法 格式 为 : 
< 变量 > = < 表达 式 > 


等 于 运算 符 (=) 的 右 侧 是 称 为 < 表达 式 > 的 表达 式 ， 它 可 以 是 代数 表达 式 、 布 尔 表 达 
式 、 或 者 其 他 任何 类 型 的 表达 式 。 左 侧 是 称 为 < 变量 > 的 变量 。 赋 值 语句 把 < 表达 式 > 的 
计算 结果 赋值 给 < 变量 >。 在 上 一 个 例子 中 ，x 被 赋值 为 值 4。 

一 旦 把 一 个 值 赋 值 给 一 个 变量 ， 在 Python 表达 式 中 就 可 以 使 用 该 变量 。 例 如 : 

> 注 

图 

当 Python 对 一 个 包含 一 个 变量 的 表达 式 进行 求 值 时 ， 将 痢 先 根据 赋 给 它 的 值 计算 变量 
的 值 ， 然 后 再 执行 表达 式 中 的 运算 。 例 如 : 

>>> 4 水 

16 
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包含 变量 的 表达 式 可 以 出 现在 赋值 语句 的 右 侧 。 例 如 


>>> Counter = 4* 文 


语句 counter = 4 * x 中 ， 冯 先 x 的 运算 结果 为 4， 然 后 表达 式 4 * 4 的 运算 结果 为 
最 后 把 16 赋值 给 变量 counter: 


>>> counter 
16 


到 目前 为 止 ， 我 们 定义 了 两 个 变量 : 值 为 4 的 变量 x 和 值 为 16 的 变量 counter。 那 么 ， 假 
设 变 量 z 还 没有 赋值 ， 结 果 会 怎样 呢 ? 请 观察 如 下 代码 : 
> > > 


TIraceback (most recent ‘call last)" 
File "<pyshell#1>", line 1, in <module> 


Ce 


< 


NameError: name 二” is not defined 

:出 乎 意料 …… 我 们 产生 了 第 一 个 错误 信息 (遗憾 的 是 ， 这 并 不 是 最 后 一 个 )。 结 果 表 
明 ， 如 果 一 个 变量 (此 处 为 z) 没有 被 赋值 ， 则 该 变量 不 存在 。 当 Python 尝试 对 一 个 未 赋 
什 的 名 称 求 值 时 ， 将 产生 一 个 错误 ， 并 输出 一 条 错误 信息 (例如 ，name 'z' is not 
defined， 即 名 称 'z' 未 定义 )。 我 们 将 在 第 4 章 详细 阐述 更 多 有 关 错 误 (又 称 之 为 异常 ) 
的 内 容 。 


局 品名 根据 如 下 操作 要 求 ， 编 写 Python 语句 并 执行 
(a) 把 整数 值 3 赋值 给 变量 a。 

(b) 把 4 赋值 给 变量 b。 

(c) 把 表达 式 a * a + b * bb 的 值 赋值 给 变量 c。 


读者 也 许 记 得 以 前 学 过 的 代数 知识 ,变量 的 值 是 可 以 改变 的 。Python 变量 的 值 也 可 以 改 
。 例 如， 假定 变量 x 的 值 最 初 为 4: 


六 六 江 
44 


现在 我 们 把 7 赋值 给 变量 x 
3 7 


> 
7 


办 此 ,赋值 语句 x = 7 把 x 的 值 从 4 改变 为 7。 





内 


注意 事项 : 赋值 运算 符 和 相等 运算 符 
请 特别 注意 区 别 赋值 运算 符 = 和 相等 运算 符 ==。 
下 面 是 一 个 赋值 语句 ， 把 7 赋值 给 变量 xX: 


> me YY 


但 是 ， 下 面 是 一 个 布尔 表达 式 ， 比 较 变 量 x 的 值 和 数值 7， 如 果 两 者 相等 ， 则 返回 


表达 式 的 运算 结果 为 True， 因 为 变量 x 的 值 为 7。 


3 这 2 六 


2.1.4 变量 名 称 


构成 变量 名 称 的 字符 可 以 是 字母 表 中 的 小 写字 母 和 大 写字 母 (从 a 到 z, 从 A 到 Z)、 下 
划 线 ( ) 和 0 到 9 的 数字 (但 数字 不 能 为 第 一 个 字符 )。 例 如 : 
e myList 和 1ist 是 有 效 的 变量 名 , 但 51ist 就 不 是 。 
e 1list6 和 1 2 是 有 效 的 变量 名 , 但 1ist-3 就 不 是 。 
e mylist 和 myList 是 不 同 的 变量 名 。 
即使 一 个 变量 名 是 “合法 ”的 ( 即 符合 命名 规则 )， 也 可 能 不 是 一 个 “好 ”的 变量 名 。 
设计 规范 的 变量 名 一 般 体 循 如 下 普遍 接受 的 惯例 : 
e 变量 名 必须 有 意义 ， 例 如， 变量 名 price 优 于 变量 名 p。 
。 多 个 单词 组 成 的 变量 名 使 用 下 划 线 作为 分 隐 符 (例如 ,temp_var 和 interest_ 
rate)， 或 者 使 用 camelCase 方式 (例如 ,tempVar、TempVar、interestRate 
或 者 InterestRate)， 请 选择 一 种 风格 并 贯彻 整个 程序 ， 
e 短小 精 悍 上 且 有 意义 的 变量 名 优 于 宛 长 的 变量 名 。 
在 本 教程 中 ， 所 有 的 变量 名 称 均 以 小 写字 母 开 始 。 


知识 拓展 : Python 3 及 其 以 上 版 本 中 的 变量 名 

变量 名 称 所 使 用 字符 的 限定 规则 仅 适 合 于 Python 3.0 之 前 的 版 本 。 这 些 旧 版 本 使 用 
ASCII 字符 编码 ( 仅 包括 英文 字母 表 中 的 字符 ,详细 描述 请 参见 第 6 章 ) 作为 默认 字符 集 。 

从 Python 3.0 版 本 开始 ，Python 默认 字符 编码 是 Unicode 字符 编码 (详细 描述 也 请 参 
见 第 6 章 )。 基 于 这 种 改变 ,许多 其 他 的 字符 (例如 ， 斯 拉夫 语 、 中 文 或 者 阿拉 伯 文 的 字符 ) 
也 可 以 用 于 变量 名 称 。 这 一 变化 反映 了 全 球 化 在 当今 世界 的 重要 社会 地 位 和 经 济 地 位 。 

到 目前 为 止 ， 大 多 数 程 序 设计 语言 依然 要 求 变 量 名 和 其 他 对 象 名 使 用 ASCII 字符 纺 
码 。 基 于 上 述 原 因 ， 虽 然 本 教材 遵循 Python 3.0 及 以 上 版 本 的 规范 ， 我 们 还 是 限制 设计 变 
量 名 时 使 用 ASCII 字符 编码 。 


Python 语言 包含 如 下 保留 关键 字 。 在 程序 中 它们 只 能 作为 Python 命令 ， 不 能 作为 变量 名 。 


False break else if not while 
None class except import or with 
True continue finally in pass yield 
and def for is raise 
as del from lambda return 
assert elif global nonlocal try 

2.2 字符 串 


除了 数值 类 型 和 布尔 类 型 ，Python 还 支持 大 量 的 其 他 复杂 数据 类 型 。Python 字符 串 类 
型 (表示 为 str)， 用 于 表示 和 处 理 文本 数据 (换言之 ,字符 序列 ， 包 括 空 格 、 标 点 符号 和 各 
种 符号 )。 字 符 串 值 使 用 一 系列 包含 在 引号 中 的 字符 表示 。 例 如 : 

>>> "Hello, World!’' 

'Hello, Worildi'! 

>>> Ss= 'hello'! 

>>> 5s 

'hello' 
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第 一 个 表达 式 ，' Hello， wor1d! ' 是 一 个 包含 字符 串 值 的 表达 式 ， 其 计算 结果 为 其 本 身 ， 
就 像 表 达 式 3 的 计算 结果 为 3。 语句 s = 'hello' 把 字符 串 'hello' 赋值 给 变量 s。 注 
意 ， 在 表达 式 中 ，s 的 计算 结果 为 其 字符 串 值 。 


2.2.1 字符 串 运 算 符 


Python 提供 了 用 于 处 理 文 本 ( 即 字符 串 值 ) 的 运算 符 。 和 数值 一 样 ， 字 符 串 可 以 使 用 比 
较 运算 符 (==、!=、<、>， 等 等 ) 进行 比较 。 例 如 ， 对 于 相等 运算 符 ==， 如 果 运 算 符 两 侧 
的 字符 串 的 值 相 同 ， 则 返回 True: 

>22 机 == helileo. 

True 

>>> 乒 = 'world' 

> 

True 

> 之 > 三 = 七 

False 


相等 运算 符 == 和 不 等 运算 符 != 用 于 测试 两 个 字符 串 是 否 相等 ， 比 较 运 算 符 < 和 > 则 使 用 
字典 序 来 比较 字符 串 。 例 如 : 


> > > 时 
True 
> > 
False 


(到 目前 为 止 ， 我 们 基于 直观 感受 理解 字典 序 ， 精确 的 定义 请 参见 6.3 节 。) 
运算 符 + 作用 于 两 个 字符 串 时 ， 运 算 结果 为 一 个 包含 两 个 字符 串 拼 接 ( 即 连接 ) 的 新 字 
符 串 。 例 如 : 


| > By 
heljlo world 


在 第 二 个 例子 中 ,变量 s 和 t+ 的 运算 结果 分 别 为 字符 串 'hello' 和 'wor1ld'， 随 后 它们 
和 一 个 空格 字符 串 ， “ 拼接 在 一 起 。 我 们 可 以 把 两 个 字符 串 相 加 ， 那 么 两 个 字符 串 是 否 可 
以 相 乘 呢 ? 

> HOGLl1Q " b world 

Traceback (most recent call last): 

File "<pyshell#146>", line 1, in <module> 
‘hello ”来 
TypeError: cannot multiply sequence by non-int of type ， 


很 显然 ， 结 末 表 明 似 乎 不 可 以 。 如 果 稍 作 思 考 ， 就 会 发 现 两 个 字符 串 相 乘 其 意义 不 明 。 字 符 
串 相 加 《〈 即 拼接 在 一 起 ) 则 看 起 来 更 有 道理 。 总 而 言 之 ，Python 程序 设计 语言 的 设计 思路 ， 
以 及 各 种 数据 类 型 ( 整 型 、 浮 点 型 、 布 尔 型 、 字 符 串 ,等 等 ) 的 标准 运算 符 (+、*、/， 等 等 ) 
的 意义 都 是 基于 直观 知识 的 。 那 么 ， 凭 直观 判断 ， 请 问 如 果 一 个 字符 串 与 一 个 整数 相 习 ,会 
产生 什么 结果 ?让 我 们 尝试 一 下 : 


> > 这 于 半生 


“Lo Melilo. " 
>>> 0 水 " 


将 一 个 字符 串 s 与 一 个 整数 k 相 乘 ， 结 果 是 x 个 字符 串 s 的 副本 拼接 在 一 起 。 注 意 ， 通 过 
把 字符 串 ，-' 乘 以 30， 可 以 非常 方便 地 获得 一 行 下 划 线 (看 到 了 吗 ? 是 不 是 对 于 展示 你 的 
简单 的 文本 输出 很 有 帮助 呢 ? ) 

使 用 运算 符 in， 可 以 检查 一 个 字符 是 否 包含 在 一 个 字符 串 中 。 例 如 ， 


攻关 六 本 "jeli6’ 
> 
True 
-=> 
False 
运算 符 in 也 可 以 用 于 检查 一 个 字符 串 是 否 包 含 在 男 一 个 字符 串 中 。 例 如 : 
> > 
True 


因为 '11' 包含 在 字符 串 s 中 ， 所 以 我 们 说 '11' 是 s 的 子 串 。 
使 用 函数 len( ) 可 以 计算 一 个 字符 串 的 长 度 。 例 如 : 


>>> len(s) 
5 


表 2-1 总 结 了 字符 串 背 用 运算 符 的 用 法 和 说 明 。 

表 2-1 字符 串 运 算 符 。 其 中 仅仅 列举 了 少数 常用 的 字符 串 运算 符 ， 实 际 上 Python 中 还 
有 许多 可 用 的 其 他 运算 符 。 通 过 在 交互 式 命 令 行 中 使 用 help() 文档 函数 ， 例 如 
help(str)， 可 以 查看 所 有 字符 串 相 关 的 帮助 列表 


用 法 说 明 
、 如 果 字 符 串 x 是 字符 串 s 的 子 字 符 串 ， 则 返回 True， 否 则 返回 False 
x not in 8 如 果 和 字符 串 x 是 字符 串 s 的 子 字 符 串 ， 则 返回 False， 否 则 返回 True 
s + 七 字符 串 s 和 字符 串 七 的 拼接 
和 n 个 字符 串 s 的 副本 的 拼接 
s[i] 字符 串 s 的 索引 i 位 置 的 字符 
len(s) 字符 串 s 的 长 度 


玫 本 首先 执行 如 下 赋值 语句 : 
3 六 训 刘 1 首位 下 


> 总 2 = bat! 
>》 3 Veod! 


使 用 sl1、s2、s3 和 运算 符 +、*， 编 写 Python 表达 式 ， 要 求 运 算 结 果 如 下 : 

(a) "ant bat cod' 

(b) 'ant ant ant ant ant ant ant ant ant ant ' 

(c) 'ant bat bat cod cod cod' 

(d) 'ant bat ant bat ant bat ant bat ant bat ant bat ant bat ' 
(e) 'batbatcod batbatcod batbatcod batbatcod batbatcod ' 
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2.2.2 索引 运算 符 

通过 索引 运算 符 []， 可 以 访问 一 个 字符 串 中 的 单个 字符 。 让 我 们 先 定 义 索 引 的 概念 : 字 
符 在 字符 串 中 的 索引 是 指 该 字符 相对 于 第 一 个 字符 的 俩 移 量 〈 即 在 字符 串 中 的 位 置 )。 第 一 
个 字符 的 索引 是 0， 第 二 个 字符 的 索引 是 1 (因为 相对 于 第 一 个 字符 偏 移 了 一 个 位 置 ), 第 三 
个 字符 的 索引 为 2， 以 此 类 推 。 索 引 运 算 符 [] 市 一 个 非 负 索引 i 返回 字符 串 中 索引 位 置 为 
i 的 单个 字符 (参见 图 2-1 ): 


>>> s[0] 


5 
> 


> EA 


S h e 1 1 0 
条 | 0 | 汪 1 
s[0] | h ] © 1 1 O 
s [1j h ee 1 L O 
s[4] kh 图 } | O 


图 2-1 字符 串 索引 和 索引 运算 符 。 索 引 0 指向 第 一 个 字符 ,索引 i 指 向 位 于 第 一 个 字符 右 侧 
第 i 个 位 置 的 字符 。 表 达 式 s[0] 使 用 索引 运算 符 [ ] ， 运 算 结果 为 'h' ; s[1] 的 运 
算 结 果 为 'e' ; s[4] 的 运算 结果 为 ，o， 


把 可 5 首先 执行 如 下 赋值 语句 : 

Ss 三 ‘O123456789'! 

然后 使 用 字符 串 s 和 索引 运算 符 [ ] 书写 表达 式 ， 表 达 式 的 计算 结果 如 下 : 

(a 

Ch 

(&) “6 

(dj 8" 

(e) '9' 

负 的 索引 可 以 用 于 从 字符 串 的 后 面 ( 右 侧 ) 访问 字符 。 例 如 ， 最 后 一 个 字符 可 以 使 用 负 
的 索引 -1 访问 ， 倒 数 第 二 个 字符 可 以 使 用 负 的 索引 -2 访问 (参见 图 2-2 ): 


> [=11 


2 


1 了 1 





负 的 索引 | 2 | 
| | | ] 
s | 
I | 本 

索引 0 | 2 4 
s[-1] h e 4 | 1 
a 


图 2-2 使 用 负 索 引 的 索引 运算 符 。 索 引 -1 指向 倒数 第 一 个 字符 ， 因 此 s[-1] 的 运算 结果 
为 'o'。s[-2] 的 运算 结果 为 'o 


我 们 才 仅 仅 接 触 到 Python 语言 文本 处 理 的 皮毛 而 已 。 本 教程 后 续 革 广 将 继续 多 次 深入 
讨论 字符 串 和 文本 处 理 。 接 下 来 ， 继 续 我 们 的 Python 数据 类 型 之 旅 。 


2.3 列表 和 元 组 


在 很 多 情况 下 ， 数 据 会 组 织 成 一 个 列表 ， 例 如 购物 车 列表 、 课 程 列 表 、 手 机 中 的 联系 人 
列表 、 音 频 播 放 融 中 的 歌曲 列表 ， 等 等 。 在 Python 语言 中 ， 列 表 通 党 存储 在 一 种 被 称 为 list 
的 对 象 类 型 中 。 一 个 列表 就 是 一 个 对 象 序列 。 对 象 可 以 是 任何 类 型 : 数值 、 字 符 串 、 甚 至 是 
其 他 列表 。 例 如 ， 下 例 是 把 变量 pets 赋值 为 一 个 表示 若干 宠物 的 字符 串 列 表 : 

2 pats = [gnldafigkh'; "cat's ‘ddg "| 

变量 pets 的 运算 结果 为 列表 : 


>>> pets 
[区 人 工人 下 cat'", ‘dog’) 


在 Python 中 ， 列 表 表 示 为 包括 在 方 括号 中 以 逗号 分 隔 的 对 象 序列 。 空 列表 表示 为 [ ] 。 列 表 
中 可 以 包含 各 种 不 同 的 数据 类 型 。 例 如 ， 如 下 名 为 things 的 列表 包括 三 个 元 素 : 第 一 个 元 
素 为 字符 串 'one' ,第 二 个 元 素 为 整数 2， 第 三 个 元 素 为 列表 [3，4]: 


>3> things = ['"one", 2, [3， 4H] 





2.3.1 列表 运算 符 


在 前 一 节 讨 论 的 大 多 数字 符 串 运算 符 同 样 适用 于 列表 。 例 如 ， 列 表 中 的 元 素 可 以 使 用 索 
引 运 算 符 访问 ， 正 如 在 字符 串 中 访问 单个 字符 : 


>>> pets[0] 
‘goldfish’ 
>>> pets[2] 
tdog， 


图 2-3 描述 了 列表 pets 及 列表 各 元 素 的 和 索引。 同样 列表 也 可 以 使 用 负 的 索引 : 

>>> pets[-1] 

表 2-2 中 列举 了 一 些 常 用 的 列表 运算 符 。 通 过 在 交互 式 命 令 行 中 使 用 help() 文档 函 
数 ， 可 以 查看 关于 list 的 所 有 帮助 列表 : 
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负 的 索引 ) - 
[ OO | YE | | 
pets Leeaarish' ||| | at 加 | 四 dog' '! 
a Cg 
索引 0 | 2 


图 2-3 字符 串 对 象 列表 。 列 表 pets 是 一 个 对 象 序列 。 位 于 索引 0 的 第 一 个 对 象 
为 "goldfish'。 和 字符 串 一 样 ， 正 的 索引 和 负 的 索引 都 可 以 使 用 


>>> help(list) 


表 2-2 ”列表 运算 符 和 函数 


用 法 说 。 有 明 
x 4 Lak 如 果 对 象 x 存在 于 列表 1st， 则 返回 True， 否 则 返回 False 
x not in lst 如 果 对 象 x 存在 于 列表 1st， 则 返回 False， 否 则 返回 True 
lstA + lstB 列表 1stA 和 列表 1stB 的 拼接 
38 Wt n 个 列表 1st 的 副本 的 拼接 
lst[i] 列表 1st 的 索引 i 位 置 的 项 
len(1st) 列表 1st 的 长 度 
min(lst) 列表 1st 中 的 最 小 项 
max(lst) 列表 1st 中 的 最 大 项 
sum(1st) 列表 1st 中 所 有 的 项 之 和 


使 用 也 数 1en ( ) 可 以 计算 一 个 列表 的 长 度 ( 即 列表 中 项 的 个 数 ): 


>>> len(pets) 
3 


和 字符 串 类 似 ， 列 表 也 可 以 “ 相 加 ”"， 意 思 是 列表 可 以 拼接 在 一 起 。 列 表 也 可 以 “ 乘 以 ” 
一 个 整数 kx， 结 采 是 列表 的 大 个 副本 拼接 在 一 起 : 


>>> pets + pets 

[raoldtinh's vabt'y dg’, goladtiah", “eat' 
>>> pets * 2 

['goldfish', Tat 5 U0R'S "goldish ys Cabs 'dog'] 


如 果 要 判断 列表 中 是 否 存在 字符 串 'rabbit'， 可 以 在 布尔 表达 式 中 使 用 in 运算 符 ， 
如 果 列 表 pets 中 存在 字符 串 ' rabbit'， 则 运算 结果 为 True: 


>>> 'rabbit' in pets 
False 

>>> 'dog' in pets 
True 


表 2-2 总 结 了 一 些 列 表 运 算 符 。 在 表 中 还 包含 了 困 数 min()、max() 和 sum()， 这 些 
四 数 均 将 一 个 列表 作为 输入 参数 ， 分 别 返回 列表 中 最 小 项 、 最 大 项 和 各 项 之 和 : 


>>> lst = [23.99，19.99，34.50，120.99j] 
>>> min(lst) 

19 .99 

>>> max(lst) 

120 .99 

>>> sum(lst) 

199 .46999999999997 


idog 
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有 用 油 首 先 执行 如 下 的 赋值 语句 : 

Words = [bat'，' Dalil，'barna'， basket，rbadmiaton+] 

然后 编写 两 个 Python 表达 式 ， 表 达 式 的 运算 结果 分 别 为 words 的 第 一 个 和 最 后 一 个 单 
词 ( 按 字典 序 )。 


2.3.2 ”列表 是 可 变 类 型 ， 字 符 串 是 不 可 变 类 型 


列表 的 一 个 重要 特性 是 其 可 变性 。 这 意味 着 列表 的 内 容 可 以 改变 。 例 如 ， 假 设 我 们 需 
要 更 加 具体 地 区 分 列表 pets 中 的 猫 的 类 别 。 如 果 和 希望 pets[1] 的 运算 结果 为 ， cymric 
cat' ， 而 不 是 'cat' ,我们 可 以 把 'cymric cat' 赋 人 给 pets [11]; 

>>> pets[1] = 'cymric cat， 

>>> 和 

"goldtish", cvnrice av", ‘dor'] 

结果 ， 列 表 在 索引 位 置 1 不 再 包含 字符 串 ，“cat ' ， 而 是 包含 字符 串 ''cymric cat'。 

虽然 列表 是 可 变 类 型 ,字符 串 却 不 是 。 这 意味 着 我 们 不 能 改变 一 个 字符 串 值 的 单个 字 

符 。 例 如 ,假设 cat 的 类 别 拼写 错误 


>>> myCat = 'tymric bat'’ 
假如 希望 把 索引 7 位 置 的 字符 从 'b' 更 改 为 'c' 。 党 试 如 下 


>>> myCat [7] = 
Traceback (most recent call last): 
File "<pyshell#35>", line 1, in <module> 


myCat [7] = 
TypeError: 'str' object does not support item assignment 
上 述 错误 信息 的 本 质 意 思 是 字符 串 的 单个 字符 (元素 ) 不 能 被 修改 (赋值 )。 字 符 串 是 不 可 变 


类 型 ， 是 否 意 味 着 无 法 修正 mycat 的 拼写 错误 呢 ? 当然 不 是 ， 我 们 可 以 把 一 个 全 新 的 值 赋 
给 变量 myCat : 


>>> myCat = 'cymric cat' 
>>> myCat 


CYymr1 Te GH " 


我 们 将 在 3.4 节 中 进一步 讨论 字符 串 和 列表 赋值 (以 及 其 他 不 可 变 类 型 和 可 变 类 型 )。 


2.3.3 ”天 组 


除了 列表 ，Python 还 支持 元 组 (tuple)。 元 组 在 很 多 地 方 与 列表 类 似 ， 但 元 组 是 不 可 变 类 
型 。 一 个 元 组 对 象 包含 行 二 包含 在 圆 括号 〈( )， 而 不 是 方 插 号 [ ] ) 中 以 逗号 分 隅 的 一 系列 值 : 


so ge = Ce, ‘Far, ‘le’) 
>>> days 


CMG 'We') 
在 类 似 下 例 赋值 语句 的 简单 表达 式 中 ， 圆 括号 是 可 选 的 : 


> aye = Na “To's "Ves "Th 
>>> days 


LM ?Pa Hes Th 
表 2-2 中 的 所 有 运算 符 同样 适用 于 元 组 。 例 如 : 
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>>> 'Fr' in days 


False 

>>> Week = days + ('Fr', 'Sa', 'Su') 

>>> week 

('NMo’, Ta We *Th', IFr*, "Sa!', "Su’) 

>>> len(week 

7 

>>> 2*week 

CWo's "Tar "We, I, "Be Se, Ra, ‘Wo, te "We", Th". 


特别 地 ,使 用 元 又 的 仿 移 量 作 为 索引 ， 可 以 使 用 索引 运算 符 来 访问 元 组 中 的 各 元 素 ， 这 
和 列表 访问 一 样 : 


>>> days [2] 


但 是 ,任何 尝试 更 改元 组 的 操作 将 导致 错误 。 例 如 : 


>>> days[4] = 't¥w’ 
Traceback (most recent call last): 


File "<pyshelil#261>", line 1, in <module> 
days[4] = 'th' 
TypeError: ‘tuple' object does not support item assignment 


因此 ， 和 列表 类 似 ， 无 组 中 的 元 素 按 顺序 排列 ， 可 以 使 用 索引 《 偏 移 量 ) 来 访问 。 与 列表 不 
同 的 是 ， 元 组 是 不 可 变 类 型 : 一 旦 创建 了 元 组 ， 就 不 能 更 改 其 内 容 。 要 了 解 元 组 支持 的 其 他 
更 多 运算 和 从 ， 可 以 阅读 在 线 帮助 文档 ， 或 者 使 用 文档 帮助 际 数 help( )。 有 关 什 么 情况 下 使 
用 元 组 而 不 是 列表 存储 一 个 序列 数据 的 说 明 ， 将 在 后 续 草 节 中 冰 述 。 在 3.4 节 、3.5 节 和 6.1 
中 包含 阐述 的 实例 。 


注意 事项 : 单元 素 元 组 
假设 我 们 需要 创建 一 个 仅仅 包含 一 个 元 素 的 元 组 ， 例 如 : 
>>> days = ('Mo') 
让 我 们 计算 对 象 days 的 值 和 类 型 . 
>>> days 
>>> type (days) 


<class 'str'> 


我 们 所 得 到 的 结果 并 不 是 一 个 元 组 ! 结果 却 是 字符 串 'Mo'。 根 本 上 讲 ， 圆 括号 被 忽略 
了 。 让 我 们 再 举 一 个 例子 来 阅 明 这 种 情况 ， 


> 
> > 

3 

>>> type(3) 


«class int!> 
很 显然 ， 圆 括号 的 处 理 方 式 类 似 于 数学 表达 式 中 的 处 理 方 式 。 事 实 上 ， 当 对 表达 式 
('Mo' ) 求 值 时 是 同样 的 处 理 方 式 。 虽 然 把 字符 串 包 括 在 圆 括 号 中 感觉 有 些 奇 怪 ，Python 
字符 串 运算 符 * 和 + 有 时 候 要 求 使 用 括号 来 指定 字符 串 运 算 求 值 应 该 遵循 的 运算 优先 级 ， 


如 下 例 所 示 : 

>>> ('Mo'+'Tu')*3 

MoTUMoTuMoT ' 

>>> 'Mo'+('Tu'*3) 

'MoTuTuTu' 

那么 ， 如 何 创建 一 个 单元 素 的 元 组 呢 ? 一 般 元 组 的 圆 括号 和 表达 式 中 的 圆 括 号 的 区 别 
在 于 ， 元 组 的 国 括 号 中 以 过 号 分 隔 各 元 素 。 因 此 ， 喜 号 是 区 分 的 关键 所 在 ， 所 以 可 以 通过 
在 第 一 个 (唯一 一 个 ) 项 目 后 面 加 过 号 ， 即 可 创建 一 个 单元 素 元 组 : 


>>> days = ('Mo',) 


让 我 们 检查 我 们 创建 的 元 组 对 象 : 


>>> days 
478O7 ,2 

>>> type(days) 
<class 'tuple'> 


2.3.4 元 组 和 列表 的 方法 
前 面 章节 我 们 列举 了 作用 于 列表 的 函数 的 使 用 方法 ， 例 如 ，min( ) 函数 : 


>>> numbers = [6，9，4，22] 
>>> min(numbers) 
4 


在 表达 式 min (numbers) 中 ,调用 了 滑 数 min() 时 带 一 个 输入 参数 : 列表 numbers， 
当然 ,Python 中 还 存在 作用 于 列表 的 也 数 。 例 如 ， 要 问 列 表 pets 中 添加 一 个 'guinea 
pig'， 可 以 调用 列表 pets 的 滑 数 append ( ) : 


>>> pets.append('guinea pig') 
>>> pets 
['goldfish', 'cymric cat', 'dog', 'guinea pie'] 


让 我 们 再 次 向 列表 pets 中 添加 一 个 'dog': 


>>> pets.append( dog ') 
>>> pets 


['goldfish', evymrie cat "do0R', Culnea Plg™, 'dog'] 
请 注意 函数 append( ) 的 特殊 调用 方法 : 
pets.append('guinea pig') 


该 调用 可 以 解释 为 : 在 列表 pets 上 调用 函数 append( ) 时 带 一 个 输入 参数 ' guinea pig'。. 
执行 语句 pets.append('guinea pig') 的 结果 是 'guinea pig' 添加 到 列表 pets 的 
后 面 。 

子 数 append() 是 一 个 列表 函数 。 这 意味 着 不 能 单独 调用 也 数 append()。 必 须 
基于 一 个 列表 1st， 使 用 语法 格式 1st.append() 进行 调用 。 我 们 把 这 类 了 哨 数 称 为 
方法 。 

列表 方法 的 另 一 个 例子 是 count ( ) 方法 。 当 在 一 个 列表 上 带 一 个 输入 参数 调用 该 限 数 
时 ， 结 果 返 回 输 入 参数 在 该 列表 中 出 现 的 次 数 : 


Python 效 据 区 型 27 


>>> pets.count('dog') 
2 

同样 ， 我 们 说 在 列表 pets 上 调用 方法 count ( ) ( 带 一 个 输入 参数 ' dog ' )。 
要 移 除 列表 中 第 一 次 出 现 的 'dog' ， 可 以 使 用 如 下 列表 方法 remove ( ) : 


>>> pets .remove('dog') 

>>> pets 

[raoldf int" , CYMmrie at so guinea D1E Sy 'dog '] 
列表 方法 reverse( ) 把 对 象 顺 序 逆序 排列 : 


>>> pets.reverse() 

>>> pets 

L'adog", 'guinea pig", cynrice at's ’'golds EE? 

表 2-3 中 列举 了 常用 的 列表 方法 。 通 过 在 交互 式 命令 行 中 使 用 help( ) 文档 艺 数 ， 可 以 
查看 所 有 的 列表 方法 。 


>>> help(list) 
Help on class list in module builtins: 


表 2-3 一 些 列表 方法 。 函 数 append()、insert()、pop()、remove()、reversel( ) 
和 sort( ) 修改 列表 1st。 要 在 交互 式 命令 行 中 获取 全 部 列表 方法 一 览 信 息 ， 可 以 使 
用 help( ) 文档 函数 


用 法 说 明 
1st.append(item) 把 元 素 item 添加 到 列表 尾部 
lst.count (item) 返回 列表 1st 中 元 素 item 出 现 的 次 数 
lst.index(item) 返回 元 素 item 在 列表 1st 中 第 一 次 出 现 的 索引 号 
lst.insert(index, item) 在 列表 中 索引 index 之 前 插入 元 素 item 
lst.pop!() 移 除 列表 中 的 最 后 一 个 项 
lst.remove (item) 移 除 列表 中 第 一 个 出 现 的 元 素 item 
1st.reversel ) 把 列表 中 的 项 逆序 排列 
1L8t。.SGCLtt() 把 列表 排序 


sort() 方法 按 升 序 (适用 于 列表 中 对 象 的 “自然 ”顺序 ) 排列 列表 中 的 元 素 。 由 于 列 
表 pets 包含 字符 串 对 象 ， 因 此 排序 方法 按 字 典 序 : 

> Pets .Sort() 

>>> pets 

['cymric at’ 3 dog ss "goldfiish , guinea pag 
一 个 数值 的 列表 排序 方法 按照 通常 的 数值 升 厅 排列 : 

> 

>>> lst.sort() 

>>> J]8t 

[2, 4 5,。8] 
如 果 针 对 一 个 包含 数值 和 字符 串 的 列表 进行 排序 ， 结 末 会 如何 呢 ?” 由 于 无 法 比较 字符 串 和 数 
值 ， 因 此 该 列表 无 法 排序 ， 将 导致 一 个 错误 。 请 读者 自己 验证 。 


给 定 一 个 学 生 家 庭 作业 成 绩 列表 : 


2 这 2 学 


Sy dd = 
请 编写 : 

(a) 求 成 绩 7 出 现 的 次 数 的 表达 式 。 

(b) 把 最 后 一 个 成 绩 修 改 为 4 的 语句 。 

(c) 求 最 好 成 绩 的 表达 式 。 

(d) 把 列表 grades 排序 的 语句 。 

(e) 求 平均 成 绩 的 表达 式 。 


继续 下 一 个 章节 内 容 之 前 ,我 们 先 讨 论 可 以 用 于 元 组 的 方法 。 我 们 曾经 提 及 ， 元 组 类 
似 于 列表 ， 但 元 组 是 不 可 变 类 型 。 查 看 表 2-3 ， 我 们 注意 到 ， 除 了 两 个 方法 ， 其 他 方法 的 调 
用 都 会 修改 列表 。 这 两 个 方法 是 count() 和 index()， 它们 也 是 唯一 可 以 适用 于 元 组 的 
方法 。 


2.4 ”对象 和 类 

迄今 为 止 ， 我 们 讨论 了 如 何 使 用 几 种 Python 支持 的 数据 类 型 . jnt、float、bool、 
str、1ist 和 tuple。 但 呈现 方法 并 非 正 式 ， 而 是 采用 直观 式 地 讨论 Python 如 何 处 理 这 
些 什 。 直 观 式 的 讨论 到 此 为 止 。 接 下 来 ,我 们 将 花 一 点 时 间 正 式 讨 论 数据 类 型 、 效 据 类 型 文 
持 的 运算 符 和 方法 的 含义 。 

在 Python 语言 中 ， 每 一 个 仁 ， 不 管 是 一 个 简单 的 整数 值 (例如 3 )， 或 者 一 个 更 为 复杂 
的 值 (例如 字符 串 'Hello， World!' 或 者 列表 ['hello'，4，5])， 都 作为 一 个 对 象 
存储 在 内 存 中 。 把 一 个 对 象 看 作 是 存储 在 计算 机 内 存 中 的 值 的 容 硕 ， 对 理解 会 很 有 帮助 。 

容器 的 思想 正 是 对 象 背后 的 目的 。 实 际 上 ， 计 算 机 系统 中 数据 (例如 ， 整 数值 ) 的 表示 
和 处 理 十 分 复杂 。 但 是 ,整数 的 算术 运算 却 是 简单 直观 的 。 对 象 是 值 (不 管 是 整数 ， 或 者 其 
他 类 型 ) 的 容器 ， 了 隐藏 了 整数 存储 和 处 理 的 复杂 性 ， 并 且 仅 为 程序 员 提 供需 要 的 信息 : 对 象 
的 值 和 所 适用 的 运算 。 


2.4.1 对象 类 型 
每 一 个 对 象 都 关联 一 个 类 型 和 值 。 图 2-4 中 描述 了 四 个 对 象 : 一 个 值 为 3 的 整 型 对 象 、 
一 个 值 为 3.0 的 浮 点 型 对 象 、 一 个 值 为 'Hello World"' 的 字符 串 对 象 和 一 个 值 为 [1，1， 
2，3，5，8] 的 列表 对 象 。 
| type: int 
3 | | 3.01 ,| {|'Hello World'|| (| [i,1,2,3,5,8]| 


‘type: float I type: str | type: list 


图 2-4 ”四 个 对 象 。 其 中 描述 了 4 个 不 同类 型 的 对 象 。 每 个 对 象 有 一 个 类 型 和 一 个 值 


一 个 对 象 的 类 型 指明 该 对 象 可 以 存储 的 值 的 类 型 以 及 该 对 象 支 持 的 操作 。 迄 今 为 止 我 们 
涉及 的 类 型 包括 : 整 型 (int)、 浮 点 型 (float)、 布 尔 型 (bool)、 字 符 串 型 (str)、 列 表 
(1ist)。 使 用 Python 的 type() 函数 可 以 确定 一 个 对 象 的 类 型 : 


>>> type(3) 
<class 'int'> 
>>> type(3.0) 
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<CLAaSS float,> 
>>> type('Heilo World') 
<CLasgs str'> 
hy 
<elhass TS 
type() 隆 数 作用 于 一 个 变量 时 ， 将 返回 该 变量 引用 的 对 象 的 类 型 . 
SS 总 二 3 
>>> type(a) 
Ca3SS Tnt "> 


注意 事项 : 变量 没有 类 型 
值得 注意 的 是 ， 变 量 没 有 类 型 。 一 个 变量 仅仅 是 一 个 名 称 。 只 有 变量 指向 的 对 象 才 属 
于 某 个 类 型 。 因 此 ， 当 下 面 结 果 : 


>>> type(a) 
<elass int'> 


实际 上 是 指 变 量 当 前 指向 的 对 象 属于 整 型 类 型 。 
我 们 强调 当前 ， 因 为 a 指向 的 对 象 的 类 型 可 能 会 被 改变 。 人 例如， 如果 把 3.0 赋值 给 a: 


a= 3.0 
则 a 将 指向 一 个 浮 点 值 : 
>>> type(a) 


«lass fioat > 


Python 程序 设计 语言 被 称 为 面向 对 象 的 程序 设计 语言 ， 因 为 所 有 的 值 总 是 存储 为 对 象 。 
有 别 于 Python， 其 他 的 程序 设计 语言 中 ， 某 些 类 型 的 值 并 不 保存 为 类 似 对 象 的 抽象 实体 ， 
而 是 直接 保存 在 内 存 中 。 术 语 类 是 指 存储 在 对 象 中 的 值 的 类 型 。 因 为 Python 语言 中 每 个 值 
都 保存 在 一 个 对 象 中 ， 因 此 每 个 Python 类 型 都 是 一 个 类 。 在 本 教程 中 ， 类 和 类 型 可 以 互 换 
使 用 。 

在 前 面 章节 中 ， 我 们 非 正 式 地 介绍 了 若干 Python 数值 类 型 。 为 了 阐述 对 象 的 类 型 的 概 
念 ， 接 下 来 我 们 将 更 加 准确 地 痢 述 其 行为 。 


2.4.2 数值 类 型 的 有 效 值 

每 个 对 象 都 有 一 个 值 ， 且 必须 为 该 对 象 类 型 的 合法 值 。 例 如 ， 一 个 整 型 对 象 的 值 可 以 为 
3， 但 不 能 为 3.0 或 者 ' three' 。 整 型 值 可 以 任意 大 。 例 如 ， 我 们 可 以 创建 一 个 值 为 2” 的 
整 型 对 象 : 


>>> x = 2**1024 
> TY 


17976931348623159077293051907890247336179769789423065727343008 
7163350510684586298239947245938479716304835356329624224137216 
实际 上 ,一 个 整 型 对 象 可 存储 的 值 的 大 小 是 有 限制 的 : 值 受 限于 可 用 的 计算 机 内 存 。 这 是 因 
为 无 法 存储 一 个 位 数 超 出 计算 机 内 存 存 储 范围 的 整 型 值 。 
Python 浮 点 型 (Eloat) 用 于 表示 实数 ， 使 用 有 限 小 数位 : 


六 


pS 


30 2 募 


>>> pi = 3.141592653589793 
>>> 2.0**30 
1073741824.0 


虽然 整 型 值 可 以 包含 任意 大 的 位 数 ( 仅 受 限于 计算 机 内 存 大 小 )， 表 示 浮 点 值 的 位 数 是 有 限 
制 的 ， 在 当今 的 笔记 本 和 台式 机 上 通常 为 64 位 。 这 意味 着 一 些 限制 。 首 先 ， 不 能 表示 超大 
的 浮 点 数 : 

>>> 2.0**1024 

Traceback (most recent call last): 

File "<pyshell#92>", line 1, in <module> 
2 .0**1024 

OQverflowError: (34, 'Result too large') 
尝试 定义 一 个 超出 浮 点 值 允许 位 数 的 浮 点 值 时 ， 会 导致 一 个 错误 。( 注 意 ， 仅 当 浮 点 值 时 才 
产生 该 错误 ， 前 面 我 们 看 到 ， 整 型 值 2**1024 没有 问题 .) 另外 ， 小 数 部 分 的 值 将 被 近似 ， 
不 能 被 精确 表示 : 

>>> 2.0**100 

1.2676506002282294e+30 


这 个 表示 方法 是 什么 意思 ? 这 是 被 称 为 科学 计数 法 的 表示 方法 ， 用 于 表示 数值 
1.2676506002282294 x 10”。 将 其 与 相对 应 的 全 精度 的 整数 值 进行 比较 : 


>>> 2**100 
1267650600228229401496703205376 


下 例 结果 的 小 数 部 分 也 做 了 近似 处 理 : 


>3> OOO 
7.888609052210118e-31 


非常 非常 小 的 值 近似 为 0: 


>>> 2.0**-1075 
GD 


2.4.3 数值 类 型 的 运算 符 
Python 语言 提供 了 运算 符 和 内 置 数 学 函数 (例如 abs() 和 min()) 用 于 构建 代数 表达 
式 。 表 2-4 列举 了 Python 语言 文 持 的 算术 表达 式 运 算 符 。 
表 2-4 数值 类 型 运算 符 。 其 中 列 出 了 可 以 用 于 数值 对 象 (例如 ，bool、int、float) 的 
运算 符 。 如 果 一 个 操作 数 为 float， 则 结果 一 定 为 float 值 ; 否则 ， 结 果 为 int 
值 。 除 法 运算 符 ( / ) 除外 ， 其 结果 总 是 为 float 值 


用 法 类 型 (如 果 x 和 y 是 整 型 ) 
x + 整 型 


和 


~X x 的 负数 整 型 


abs (x) x 的 绝对 值 整 型 


X ** 了 x 的 y 次 方 整 型 


hg 
Y 


Python 履 据 类 型 31 


除法 ( /) 以 外 的 运算 操作 都 遵循 如 下 规则 : 如 果 两 个 操作 数 x 和 y ( 单 目 运算 符 - 以 及 
abs()， 则 仅 有 一 个 操作 数 x) 为 整数 ， 则 结果 为 整数 。 如 果 其 中 有 一 个 操作 数 是 浮 点 值 ， 
则 结果 为 浮 点 值 。 对 于 除法 运算 符 (/)， 不管 操作 数 是 什么 数据 类 型 ， 结 果 总 是 为 浮 点 值 。 

比较 运算 符 用 于 比较 值 。Python 语言 包括 六 个 比较 运算 操作 ， 如 表 2-5 所 示 。 

表 2-5 比较 运算 符 。 使 用 比较 运算 符 ， 可 以 比较 两 个 相同 或 不 同类 型 的 数值 


用 法 说 明 用 法 说 明 
< 到 大 





> 大 | = | A 
值得 注意 的 是 ，Python 语言 中 ， 比 较 运算 操作 可 以 任意 链接 。 例 如 : 


>35. 3 Ks; 34 
True 


当 一 个 表达 式 包含 多 个 运算 符 时 ， 表 达 式 的 运算 要 求 规定 一 个 顺序 。 例 如 ， 表 达 式 2 * 3 
+ 1 的 计算 结果 是 7 还 是 8? 


> > > 
7 


运算 符 计算 的 顺序 要 么 使 用 插 号 显 式 指定 ， 要 么 隐 式 遵循 运算 符 优先 级 规则 (如果 运算 符 优 
先 级 相同 ， 则 遵循 从 左 到 右 的 运算 规则 )。Python 语言 的 运算 符 优先 级 规则 遵循 代数 规则 ， 
描述 如 表 2-6 所 示 。 注 意 ， 依 赖 于 从 左 到 右 规则 容易 犯错 ， 所 以 好 的 开发 人 员 会 使 用 括号 指 
定 优先 级 。 例 如 ， 可 以 依赖 于 从 左 到 右 的 规则 计算 下 列表 达 式 的 值 : 


> 2 =- + 1 
0 


但 一 个 好 的 开发 人 员 会 使 用 括号 更 清晰 地 表达 其 意图 : 
3 2 = 3)}+ 1 
0 
表 2-6 运算 符 优 先 级 。 其 中 按 优先 级 顺序 (从 高 到 低 ) 列 出 运算 符 ， 同 一 行 的 运算 符 的 优 
先 级 相同 。 优 先 级 高 的 运算 符 先 执行 ， 相 同 优先 级 的 运算 符 按 从 左 到 右 顺序 执行 


用 法 说 了 明 
[ 表达 式 …] 列表 定义 
x[], x[index:index] 索引 运算 符 
类 乘 宕 
+X、—X 正 号 、 负 号 
7 乘法 、 除 法 、 整 除 、 取 模 ( 求 余 数 ) 
+、- 加 法 、 减 法 
in、not in、<、<=、>、>=、<>、!=、== 比较 ， 包 括 成 员 测试 以 及 同一 性 测试 
not x 布尔 非 
and 布尔 与 
or 布尔 或 


请 描述 如 下 表达 式 的 计算 顺序 : 


(二 十 二 ES 


32 锚 2 至 


(b) ISTL Ww -3 < =10 三 = 

(Ce) (18E[1] w =3 < sli0) in (10, Truel] 
(d) 2 * 3**2 

fF 


2.4.4 创建 对 象 
要 创建 一 个 值 为 3 的 整 型 对 象 (并 把 它 赋 值 给 变量 x)， 可 以 使 用 如 下 语句 : 
>>> X= 

注意 ， 并 没有 明确 指定 创建 整 型 对 象 。Python 还 支持 显 式 指定 创建 对 象 类 型 的 方法 : 


>>> X = int(3) 
>>> x 
过 


曙 数 int() 被 称 为 构造 函数 。 它 用 于 显 式 实例 化 一 个 整 型 对 象 。 对 象 的 值 由 因数 参数 确 
定 : 使 用 int(3) 创建 的 对 象 ， 其 值 为 3。 如 果 没 有 给 定 参 数 ， 则 把 默认 值 赋 给 创建 的 
对 象 。 


Sy 
>>> x 
0 


因此 ， 整 型 对 象 的 默认 值 是 0。 
浮 点 型 、 列 表 和 字符 串 类 型 的 构造 函数 分 别 为 float()、1list() 和 str()。 我 们 可 
以 使 用 无 参 构造 郧 数 确认 其 软 认 值 。 对 于 浮 点 型 对 象 ， 默 认 值 是 0.0: 


>>> y = float() 
> 
0.0 


字符 串 和 列表 的 默认 值 分 别 为 ''( 空 字符 串 ) 和 [ ] ( 空 列表 ): 
> = I() 


> 


yy Lat = 145E() 
>>> lst 


[] 


2.4.5 ” 隐 式 类 型 转换 

如 果 一 个 代数 表达 式 或 逻辑 表达 式 中 包含 不 同类 型 的 操作 数 ， 则 Python 会 把 每 个 操作 
数 转换 为 男 一 个 包含 其 他 类 型 的 类 型 。 例如， 在 整 型 加 法 运算 之 前 ，True 会 转换 为 1， 执 
行 结果 为 一 个 整数 . 


>>> 工 Te: + 5 
6 


这 种 看 起 来 奇怪 的 行为 的 原因 在 于 ,布尔 类 型 实际 上 是 整 型 类 型 的 “ 子 类 型 "， 如 图 2-5 所 
示 。 布 尔 值 rrue 和 False， 在 大 多 数 场合 下 ， 一 般 分 别 相 当 于 值 1 和 0。 
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int Float 


到 2-5 数值 类 型 转换 。 在 不 同类 型 操作 数 的 算术 表达 式 中 ， 值 会 转换 为 包含 其 他 类 型 的 类 型 。 
数值 类 型 包含 关系 如 图 2-5 所 示 。 注 意 ， 从 整 型 到 浮 点 型 的 转换 可 能 会 导致 溢出 


因为 整数 可 以 用 小 数 点 记 法 来 表示 (3 就 是 3.0 ), 但 反 过 来 则 不 可 以 (2.63 不 能 表示 
为 一 个 整数 )， 故 int 类 型 包含 在 float 类 型 之 中 ， 如 图 2-5 所 示 。 考 虑 一 个 例子 ， 表 达 式 
3 + 0.35 中 ,一 个 int 值 和 一 个 Eloat 值 相 加 。 因 为 float 类 型 包含 int 类 型 ， 因 此 
3 被 转换 为 3.0， 人 然后 执行 两 个 浮 点 数值 的 加 法 运算 : 

-> 

S35 


-一 一 


注意 事项 : 从 int 转换 为 float 
回顾 前 文 ，int 对 参 的 值 的 范围 远 远 大 于 float 对象。 虽然 nt 类 型 包含 在 
float 类 型 之 中 ， 这 并 不 意味 着 int 都 可 以 转换 为 float 值 。 例如 ，2**10000+3 的 
计算 结果 对 于 int 值 没 有 任何 问题 ， 但 转换 为 float 时 会 导致 溢出 : 
>>> 2**10000+3.0 
Traceback (most recent call last): 
File "<pyshell#139>", line 1, in <module> 


2**10000+3.0 
QverflowError: Python int too large to convert to C double 


2.4.6 ” 显 式 类 型 转换 


类 型 转换 还 可 以 通过 使 用 前 面 介绍 的 构造 男 数 进行 显 式 转换 。 例 如 ，int() 构造 水 数 
可 以 基于 一 个 float 类 型 输入 参数 创建 一 个 整 型 对 象 ， 转 换 方法 是 把 小 数 部 分 去 掉 : 


SD int(Cs, MA) 
3 

S53 Tv -3,6) 
-3 


构造 限 数 float ( ) 作用 于 一 个 整数 ， 将 改变 其 表示 方式 为 浮 点 数 ， 如 果 发 生 洲 出 则 报错 。 


X>y> Float(t3) 
3; 


字符 串 也 可 以 转换 为 数值 类 型 ， 只 要 字符 串 有 数值 意义 ( 即 字符 串 是 目标 类 型 的 有 效 表 
否则 ， 将 导致 错误 : 


2 
Traceback (most recent call last): 
File "<pyshell#123>"*, line 1, in <module> 
i 
ValueError: invalid literal for int() with base 10: '3.4 
Xp ELDat("3., 7 
3.4 


i 


不 
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字符 串 构造 了 数 str( ) 作用 于 一 个 数值 时 ， 将 返回 该 数值 的 字符 串 表示 形式 : 
Ss 2 PT) 

和 

下 列表 达 式 的 计算 结果 分 别 是 什么 数据 类 型 ? 

(a) False + False 

Lb) 2 e200 

(6) 下 衣 本 二 大 忽 汉 

(d) 2+3==40r5>=5 


2.4.7 类 方法 和 面向 对 象 的 程序 设计 


一 个 类 型 ( 即 类 ) 可 以 看 作 是 所 有 可 以 作用 于 该 类 的 对 象 的 运算 符 和 方法 的 集合 。 例 
如 ， 类 1ist 可 以 定义 为 list 类 的 运算 符 和 方法 ，1ist 类 的 部 分 运算 符 和 方法 请 参见 
表 2-2 和 表 2-3。 前 文中 曾经 使 用 1list 的 append()、count() 和 remove() 方 法 。 
例如 : 

> Dats = [L'agoldfish', 有 "dog')] 

> pets.append('guinea pig') 

>>> pets.append('dog') 

>>> pets 

[L'goladfish', ‘at, dors Tuna Pig 'dog '] 

>>> pets.count('dog') 

2 

>>> pets.remove('dog') 

>>> pets 

['goldfish', at , "gunea pir s 'dog'] 

>>> pets.reverse() 

>>> pets 


' ep i Dp S i EE Pp -A | ' 
['dog s guUinea pg , "cat, goldiish ] 


要 查看 类 1ist 文 持 的 所 有 方法 ， 可 以 使 用 help( ) 文档 工具 : 
>>> help(list) 


我 们 现在 正式 解释 前 面 方法 调用 的 表示 方法 。 在 每 一 个 例子 中 ， 有 一 个 list 对象 
pets， 后 跟 圆 点 (.)， 后 跟 方 法 (也 数 ) 调用 。 例 如 : 


pets.append('guinea pig') 


其 含义 是 : 使 用 输入 字符 串 参 数 'guinea pig' 调用 列表 对 和 象 pets 的 列表 方法 append( ) 。 
一 般 而 言 ， 表 示 法 ; 
o.m(x,y) 


其 含义 是 使 用 输入 参数 x 和 y 调用 对 象 o 的 方法 m。 方 法 m 必须 是 对 象 o 所 属 类 的 方法 。 

Python 语言 的 每 一 个 操作 都 是 这 种 格式 的 方法 调用 。 也 许 你 会 质问 ， 表达 式 x + y 并 
不 像 这 种 格式 ， 实 际 上 是 ， 我 们 将 在 第 8 章 讨论 。 这 种 处 理 数据 的 方法 (数据 储存 在 对 象 
中 ， 针 对 对 象 调用 方法 ) 称 之 为 面向 对 象 程序 设计 (OOP)。 面 向 对 象 程序 设计 是 代码 组 织 
和 开发 的 强大 方法 。 我 们 将 在 第 8 草 深 和 人 学 习 。 
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2.5 ”Python 标准 库 


核心 Python 程序 设计 语言 包括 一 些 曙 数 (例如 max() 和 sum()) 和 类 (例如 int、 
str 和 1ist)。 而 并 不 是 所 有 的 孔 数 和 类 都 是 Python 内 置 的 ， 基 于 高 效 和 易 用 性 的 目 
的 ，Python 语言 的 核心 特性 保持 精简 。 除 了 核心 果 数 和 类 之 外 ，Python 标准 库 中 还 定义 
了 许 许多 多 的 果 数 和 类 。Python 标准 库 由 数 千 个 果 数 和 类 组 成 ， 它 们 被 组 织 成 称 为 医 妖 的 
组 件 。 

每 个 模块 包含 一 组 特定 应 用 领域 相关 的 图 数 和 /或 类 。 超 过 200 个 内 置 模块 一 起 构成 了 
Python 标准 库 。 标 准 库 中 的 每 个 模块 中 包含 的 浮 数 和 类 支持 在 某 些 特定 领域 的 应 用 程序 编 
程 。 标 准 库 中 包含 的 模块 支持 如 下 应 用 : 

e 网 络 编 程 

e Web 应 用 程序 编程 

e 图 形 用 户 弄 面 (GUI) 开发 

。 数据 库 程 序 设计 

e 数学 阴 数 

e 伪 随 机 数 发 生 需 

我 们 最 终 将 使 用 所 有 这 些 模块 。 现 在 我 们 将 学 习 如 何 使 用 math 模块 和 fraction 
模块 。 


2.5.1 math 模块 


Python 语言 核心 仅 支持 基本 的 数学 运算 符 ， 这 些 在 本 章 前 面 章节 已 经 学 习 过 。 如 果 要 
使 用 其 他 的 数学 函数 (例如 平方 根 函 数 ) 和 三 角 函 数 ， 则 需要 数学 模块 。 数 学 模块 是 包含 数 
学 常量 和 范 数 的 库 。 要 使 用 数学 模块 中 的 函数 ， 必 须 先 显 式 导入 该 模块 


>>> import math 


import 语句 使 得 所 有 定义 在 模块 math 中 的 数学 函数 可 用 (有 关 import 语句 工作 原理 的 
详细 介绍 ， 请 参见 下 一 章 和 第 6 章 )。 

平方 根 师 数 sqrt( ) 定义 在 math 模块 中 ， 但 不 能 按 如 下 方法 直接 使 用 : 

> Sart(3y 

Traceback (most recent call last): 

File "<pyshell#28>", line 1, in <module> 
sqrt (3) 

NameError: name 'soart' is not defined 
很 显然 ，Python 解释 需 无 法 解析 sqrt (平方 根 果 数 的 名 称 )。 我 们 必须 显 式 告诉 解释 硕 在 
何 处 查找 该 名 称 : 

>>> math.sqrt(3) 

1.7320508075688772 

表 2-7 列举 了 定义 在 数学 模块 中 一 些 和 常用 的 水 数 。 表 中 还 包括 定义 在 模块 中 的 两 个 党 
用 数学 常量 。 变 量 math .pi 的 值 是 数学 常量 x 的 近似 值 ，math .e 的 值 是 欧 拉 常量 e 的 近 
似 值 。 


表 2-7 math 模块 。 其 中 列 出 了 math 模块 中 的 一 些 了 项 数 和 常量 。 导 入 math 模块 之 后 ， 在 
交互 式 命令 行 中 通过 help() 函数 ， 可 以 获取 全 部 函数 和 常量 一 览 


用 法 说 明 
sqrt(x) Vx 
ceil(x) [x| ( 即 大 于 或 等 于 x 的 最 小 整数 ) 
floor(x) |x | ( 即 小 于 或 等 于 x 的 最 大 整数 ) 
COS(X) CcOs(X) 
sin(x) sin(x) 
log(x, base) logbase(7) 
pi 3.141592653589793 
© 2.718281828459045 


根据 如 下 要 求 编写 Python 表达 式 : 

(a) 两 条 直角 边 边 长 分 别 为 a 和 bb 的 直角 三 角形 的 儿 边 长 度 。 

(b) 判断 上 述 斜 边 长 度 是 否 等 于 5 的 表达 式 。 

(c) 半径 为 a 的 圆 盘 的 面积 。 

(d) 判断 坐标 为 X 和 Yy 的 点 是 否 位 于 中 心 位 置 为 (a, D) 且 半 径 为 工 的 圆 内 的 表达 式 。 


2.5.2 ” fractions 模块 


fractions 模块 引入 了 一 种 新 的 数值 类 型 ， 分数 类 型 。 分 数 类 型 用 于 表示 分 数 ， 执 行 
有 理 数 算术 运算 ， 例 如 : 
1 


I 
"i 


要 使 用 fractions 模块 ， 必 须 先 导 人 该 模块 : 
>>> import fractions 


要 创建 一 个 分 数 对 象 ， 可 以 使 用 Fraction( ) 构造 辆 数 并 带 两 个 参数 : 分 子 和 分 母 。 
定义 分 数 3/4 和 1/2 的 方法 如 下 : 

>>> a = fractions.Fraction(3, 4) 

>>5 DB = fractions. Fraction(1, 2) 
注意 ， 必 须 指定 类 Fraction 的 位 置 (位 于 fractions 模块 )。 表 达 式 a 的 计算 结果 
如 下 : 


> a 
Fraction(3, 4) 


注意 ，a 的 计算 结果 不 是 0.75。 
和 其 他 数值 一 样 ，Fraction 对 象 可 以 相 加 ， 结 果 是 一 个 Fraction 对 象 : 


> GD 
>>> c 
Fraction(5, 4) 


那么 ，float 类 型 和 fractions .Fraction 有 什么 区 别 呢 ”前面 我 们 提 到 ，float 值 使 


心 | CT 
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用 有 限 的 位 数 (通常 为 64 位) 存储 在 计算 机 中 。 这 意味 着 ELloat 对 象 可 以 存储 的 值 的 范围 
有 限制 。 例 如 ，0.5” 无 法 存储 为 一 个 Eloat 值 ， 因 此 其 运算 结果 为 0: 


>>> 0.5**1075 
0.0 


然而 ，fractions .Fraction 对 象 可 以 表示 的 值 的 范围 则 非常 大 ( 仪 受 限于 内 存 大 小 ， 和 
int 类 型 一 样 )。 所 以 可 以 使 用 如 下 方式 很 容易 地 计算 (1/2)”: 


>>> fractions.Fraction(1, 2)**1075 

Fraction(1, 404804506614621236704990693437834614099113299528284236 
713802716054860679135990693783920767402874248990374155728633623822 
779617474771586953734026799881477019843034848553132722728933815484 
186432682479535356945490137124014966849385397236206711298319112681 
620113024717539104666829230461005064372655017292012526615415482186 
989568) 


那 为 什么 不 一 直 使 用 fractions .Fraction 类 型 呢 ? 这 是 因为 包括 Eloat 值 的 表达 式 的 
计算 速度 要 远 远 高 于 包含 fractions .Fraction 值 的 表达 式 的 计算 速度 。 


2.6 ”电子 教程 案例 研究 : 海 包 图 形 


在 案例 研究 CS.2 中 ， 我 们 使 用 图 形 工具 (可 视 化 地 ) 描述 本 章 涉 及 的 内 容 : 对 象 、 类 
和 类 方法 、 面 向 对 象 程序 设计 以 及 模块 。 海 龟 绘 图 工具 允许 用 户 绘制 直线 和 各 种 形状 ， 类 似 
于 使 用 钢笔 在 纸 上 绘制 图 形 . 


2.7 本章 小 结 


本 革 是 Python 语言 基本 概念 和 核心 内 置 数据 类 型 的 概述 ， 

我 们 介绍 了 使 用 交互 式 命令 行 计算 表达 式 的 值 。 我 们 首先 介绍 了 运算 结果 为 数值 的 代数 
表达 式 ， 以 及 运算 结果 为 True 和 False 的 布尔 表达 式 。 我 们 还 介绍 了 变量 和 赋值 语句 ， 
赋值 语句 用 于 给 一 个 变量 名 赋 一 个 值 。 

本 章 介 绍 了 核心 Python 内 置 数据 类 型 : int、float、boolLl、str、1List 和 tuple。 
我 们 讨论 了 内 置 的 数值 运算 待 ， 解 释 了 各 种 数值 类 型 ( int 、float 和 bool) 的 不 同 之 处 。 
我 们 介绍 了 字符 串 ( str) 运算 符 (字符 串 方法 将 在 第 4 草 讨 论 )。 我 们 特别 讨论 了 极其 重要 
的 案 引 运算 符 。 关 于 List 和 tuple 类 型 ， 我 们 介绍 了 其 运算 符 和 方法 。 

在 讨论 了 者 干 内 置 类 之 后 ， 我 们 进一步 讨论 了 对 象 和 类 的 概念 。 然 后 我 们 使 用 这 些 概 念 
来 讨论 类 构造 另 数 和 类 型 转换 。 

Python 标准 库 包 含 许 多 模块 ， 这 些 模块 包含 了 大 量 内 置 图 数 和 类 型 没有 涉及 的 病 数 和 
类 型 。 我 们 介绍 了 非常 实用 的 math 模块 ，math 模块 提供 了 许多 经 典 的 数学 曙 数 。 


2.8 ”练习 题 答案 


2.1 表达 式 分 别 为 : 
(本 和 本 本 站 
(2 和 
(wr 403 7 373 
(d) 403 $$ 了 3 
(e) 2**10 


.2 


2.3 


2.4 


pp 


2 
2 


2.8 


起. 


2.10 


(f) abs(54 - 57) 
(g) min(34.99, 29.95, 31.50) 


布尔 表达 式 分 别 为 : 

(a) 2 + 2 < 4， 运算 结果 为 : False 

(b) 7 // 3 == 1 + 1， 运算 结果 为 ; True 
(c) 3**2 + 4**2 == 25， 运算 结果 为 : True 
(d)2 + 4 + 6 > 12, 运算 结果 为 : False 
(e) 1387 % 19 == 0， 运算 结 果 为 : True 
(f) 31 $$ 2 == 0， 运 算 结 果 为 : False 


(g) min(34.99，29.95，31.50) < 30.00, 运算 结果 为 : True 
交互 式 命令 行 中 的 语句 系列 为 : 


>>> a = 3 
>>> b= 4 
>>> c=a*a+b*b 


表达 式 分 别 为 : 

(a) sl + ''+ s2+''+ s3 

LB 0 
(wj 
(d)7* (sl+ :+ 824+'') 

(Bj 和 [2 7) 

表达 式 分 别 为 : 

(naj ro (baril, lo ET6T dj [0], (6 BL9Ts 
表达 式 为 min(words) 和 max(words )。 

方法 调用 为 : 

(a) grades .count(7) 

(b) grades[-1] = 4 

(c) max(grades) 

(d) grades .sort( ) 

(e) sum(grades) / lenl(grades) 

优先 级 顺序 使 用 括号 表示 为 : 

(a) ((2 + 3) == 4) OF (a >= 5) 
人 

EC TEL DO Yn TO. Tima 
(a 2 

ley TR mT 

请 读者 在 交互 式 命令 行 中 自己 通过 对 这 些 表达 式 求 值 检 查 答案 的 正确 性 。 


(a) 当 两 个 操作 数 为 布尔 值 时 ，+ 运算 符 是 一 个 int 运算 符 ， 而 不 是 布尔 运算 符 。 结 果 0 是 一 个 


int 值 。 
(bj float 值 。 
(ce) int 值 。 
(d) or 运算 符 两 侧 的 表达 式 的 运算 结果 都 是 布尔 值 ， 因 此 结果 是 一 个 布尔 值 。 
表达 式 分 别 为 : 
(a) math.sqrt(a**2 + b**2) 
(b) math.sqrt(a**2 + b**2) == 
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(c) math.pi * a**2 


(dy (RW = Bj + {YY = By**2 < Bw*2 


习题 
根据 如 下 语句 编写 Python 表达 式 : 
(a) 负数 -7 到 -1 的 累加 和 。 


(b) 一 组 夏令 营 中 孩子 的 平均 年 龄 ， 假 设 17 个 9 岁 、24 个 10 岁 、21 个 11 岁 、27 个 12 罗 。 


(z) 2 的 一 20 次 方 。 

(d) 4356 中 包含 了 多 少 个 61 ? 

(e) 4356 除 以 61 的 余数 。 

首先 在 交互 式 命令 行 中 执行 如 下 赋值 语句 : 
Sy 1 


>>> S2 a 


接 下 来 编写 字符 串 表达 式 ， 使 用 字符 串 sl 和 s2 以 及 字符 串 运 算 符 + 和 *， 要 求 表达 式 的 


运算 结果 如 下 : 

(a 

(b) '-+-! 

和 

(d) +--+--， 

(e) 十 -一 十 一 一 十 一 一 十 一 一 十 一 一 十 一 一 十 一 一 十 一 一 十 一 一 十 一 一 十 ! 


(f) ' 十 = 十 十 十 一 一 十 一 十 十 十 一 一 十 一 十 十 十 一 一 十 一 十 十 十 一 一 十 一 十 十 十 一 一 ! 


首先 在 交互 式 命令 行 中 运行 如 下 赋值 语句 : 


>>> S =.'abcdefghijklmnopgrstuvwxyz 


接 下 来 编写 表达 式 ， 使 用 字符 串 s 和 索引 运算 符 ， 要 求 表达 式 的 运算 结果 为 : ， 


站 war 和 os 


首先 执行 如 下 语句 : 
S = goodbye 


然后 编写 布尔 表达 式 检查 是 否 : 
(a) 字符 串 s 的 第 一 个 字符 是 'g'。 
(b) 字符 串 s 的 第 七 个 字符 是 'g ' 。 
(c) 字符 串 s 的 前 两 个 字符 是 'g' 和 'a'。 
(d) 字符 串 s 的 倒数 第 二 个 字符 是 ' x' 。 
(e) 字符 串 s 的 中 间 字 符 是 'd' 。 
(f) 字符 串 s 的 第 一 个 和 最 后 一 个 字符 相等 。 
(g) 字符 串 s 的 后 面 4 个 字符 是 'tion'。 


be! 


注意 : 上 述 七 个 表达 式 的 运算 结果 应 该 分 别 为 : True、False、False、False、True、 


False 和 False。 
根据 如 下 语句 编写 Python 表达 式 : 


(a) 单词 "anachronistically" 的 字符 个 数 比 单词 "counterintuitive" 的 字符 个 数 多 1 个 。 


(b) 单词 "misinterpretation" 在 字典 中 位 于 单词 "misrepresentation" 之 前 。 
(c) 字母 "e" 不 包含 在 单词 "floccinaucinihilipilification" 中 。 
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(d) 单词 "counterrevolution" 的 字符 个 数 等 于 单词 "counter" 和 "resolution" 的 字符 个 数 之 和 。 

编写 相对 应 的 Python 赋值 语句 : 

(a) 把 6 赋值 给 变量 a， 把 7 赋值 给 变量 

(b) 把 变量 a 和 的 平均 值 赋值 给 变量 c。 

(c) 把 变量 inventory 赋值 为 包含 字符 串 'paper'、'staples' 和 'pencils' 的 列表 。 

d) 分 别 把 变量 first、middle 和 last 赋值 为 字符 串 'John'、'Fitzgerald' 和 'Kennedy '。 

(e) 把 变量 fullname 赋值 为 字符 串 变 量 first、middle 和 1ast 的 拼接 。 请 确保 使 用 适当 
的 空格 。 

使 用 习题 2.16 中 定义 的 变量 ， 根 据 下 列 逻 辑 语句 编写 布尔 表达 式 并 对 表达 式 求 值 : 

(1 和 9 之 和 小 了 19。 

(b) 列表 inventory 的 长 度 大 于 字符 串 fullname 的 长 度 的 $ 倍 。 

6 下 不 太 于 24。 

(d) 6.75 位 于 整数 a 和 b 之 间 。 

(e) 字符 串 middle 的 长 度 大 于 字符 串 fizst 的 长 度 但 小 于 字符 串 last 的 长 度 。 

(f) 列表 inventory 或 者 为 空 或 者 包含 10 个 以 上 的 对 象 。 

根据 下 列 要 求 编 写 Python 语句 : 

(a) 把 变量 flowers 赋值 为 一 个 包含 字符 串 'zrose' 、'bougainvillea'、yucca' 、'mari 
gcla"、'dqaylLilIly'， 和 "LiL1LL7 of the valley' 的 列表 。 

b) 编写 一 个 布尔 表达 式 并 对 表达 式 求 值 ， 如 果 字 符 串 'potato' 包含 在 列表 flowers 中 ， 
则 返回 True。 

(c) 把 列表 thorny 赋值 为 包含 列表 flowers 的 前 三 个 对 象 的 子 列表 。 

(d) 把 列表 poisonous 赋值 为 包含 列表 flowers 的 最 后 一 个 对 象 的 子 列 表 。 

(e) 把 列表 dangerous 赋值 为 列表 thorny 和 列表 poisonous 的 拼接 。 

首先 把 变量 answers 赋值 为 一 个 包含 任意 字符 串 'Y' 和 'N 序列 的 列表 。 例 如 : 
dnswers = TE mR yy Ns “Es “BV 

然后 根据 下 列 要 求 编 写 Python 语句 : 

(a) 把 变量 numYes 赋值 为 'Y' 在 列表 answers 中 出 现 的 次 数 。 

(b) 把 变量 numNo 赋值 为 'N' 在 列表 answers 中 出 现 的 次 数 。 

(c) 把 变量 percentYes 赋值 为 "Y' 在 列表 answers 中 出 现 的 百分比 。 

(d) 对 列表 answers 排序 。 

(e) 把 变量 £ 赋值 为 'Y' 在 排序 后 的 列表 answers 中 第 一 次 出 现 的 索引 位 置 。 

编写 一 个 表达 式 ， 把 一 个 包含 三 个 字母 的 字符 串 s 逆序 ， 即 表达 式 运 算 结 果 为 s 的 反 序 字符 串 。 

如 有 果 s 为 'top' ， 则 表达 式 运 算 结 果 为 'pot， 

编写 一 个 表达 式 ， 字 符 串 s 和 七 分 别 包含 一 木 大 的 妈 和 属 ， 表达 式 运 te 

母 缩 写 。 如 果 两 个 字符 串 包 含 本 教程 作者 的 名 和 姓 (Ljubomir Perkovic)， 则 表达 式 运算 结 

为 'LP'。 

一 个 数值 列表 的 范围 是 列表 中 任意 两 个 值 的 最 大 差 。 编 写 一 个 Python 表达 式 ， 计 算 一 个 数值 列 

表 1st 的 范围 。 假 如 ,1st 为 [3，7，-2，12]， 则 表达 式 的 计算 结果 为 14 ( 12 和 -2 的 差 )。 

首先 分 别 给 两 个 变量 monthsL (列表 ) 和 monthsT (元 组 ) 赋值 ， 都 依次 包含 字符 

串 'Jan'、'Feb'、'Mar' 和 'May'。 然 后 ， 针 对 这 两 个 容器 ， 分 别 编写 执行 下 列 操作 的 语句 : 

(a) 在 'Mar' 和 'May' 之 间 插 入 'Apr'。 

(b) 添加 字符 串 ' Jun'。 

(c) 从 容器 中 pop 出 一 个 项 目 。 

(d) 从 容 融 中 移 除 第 二 个 项 目 。 
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(e) 把 容 带 中 的 项 目 反 序 排 罗 。 
(f) 把 容 需 中 的 项 目 排序 。 
注意 : 在 元 组 monthsT 上 尝试 上 述 操作 会 导致 错误 。 
首先 把 变量 grades 赋值 为 一 个 包含 任意 成 绩 (字符 串 'A'、'B'、'C'、'D' 和 'F') 序列 的 
列表 。 例 如 : 
了 
编写 一 系列 Python 语句 ， 最 终 产 生 一 个 包含 列表 grades 中 各 成 绩 ( 按 字典 序 ) 出 现 的 次 数 的 
列表 count。 对 于 上 述 给 定 的 例子 ， 列 表 结 果 为 [4，4，2, 2, 1]。 
修改 习题 2.24， 把 变量 grades 定义 为 元 组 类 型 而 不 是 列表 类 型 ， 即 . 
ge a 
变量 count 依旧 指 回 一 个 列表 。 
半径 为 10 的 圆 形 飞镖 半 以 及 其 所 悬挂 的 墙 面 可 以 使 用 二 维 坐 标 系统 来 表示 。 镖 靶 的 中 心 位 置 坐 
标 为 (0，0 )。 变 量 x 和 y 存储 飞镖 击 中 位 置 的 x 坐标 和 yy 坐标。 编写 一 个 使 用 x 和 yy 的 表达 
式 ， 如 果 飞 镖 击 中 标 靶 (位 于 圆 形 之 内 )， 则 表达 式 计算 结 果 为 True。 并 计算 如 下 飞镖 击 中 位 
置 坐 标的 表达 式 求 值 结果 : 
0) 
(Bt 1 TQ 
(ey 6 =6) 
(Gy) 一， 名) 
徘 在 墙 上 的 梯子 与 墙 的 角度 要 小 于 90 度 ， 否 则 梯子 会 倒 下 。 假 设 变量 length 和 angle 分 别 
存储 梯子 的 长 度 和 梯子 靠 在 墙 上 与 地 面 形 成 的 夹 角 ， 编 写 一 个 使 用 length 和 angle 的 表达 
式 ， 计 算 梯子 抵 靠 在 墙 上 的 高 度 。 使 用 下 列 length 和 angle 值 对 表达 式 进 行 求 值 : 
(a) 16 英尺 ?和 75 度 
(b) 20 英 矿 和 0 度 
(c) 24 英尺 和 45 度 
(d) 24 英尺 和 80 度 
提示 : 可 以 使 用 三 角 公 式 height = length * sin(angle)。 
math 模块 的 sin() 因数 市 一 个 单位 为 踊 度 的 输入 参数 。 因 此 必须 把 单位 为 度 的 角度 转换 
为 单位 为 弧度 的 角度 ， 转 换 公 式 为 : 
T*degrees 
180 
根据 下 列 要 求 ， 编 写 Python 表达 式 或 语句 ， 使 用 数值 列表 lst 以 及 列表 运算 符 和 方法 ， 实 现 如 
下 要 求 : 
(a) 编写 表达 式 ， 求 出 列表 1st 中 间 元 素 的 索引 值 。 
(b) 编写 表达 式 ， 求 出 列表 1st 中 间 元 素 的 值 。 
(c) 编写 语句 ， 将 列表 1st 按 升 序 排序 。 
(d) 编写 语句， 将 列表 的 第 一 个 元 素 移 除 并 把 它 添加 到 列表 尾部 。 
注意 : 如 果 列 表 的 长 度 是 偶数 ， 则 列表 的 中 间 元 素 为 列表 中 间 两 个 元 素 右边 的 一 个 。 
为 下 列表 达 式 添加 括号 对 使 得 其 求 值 结 果 为 True。 


Tadlans Se 


(al 0 == 1 == 
(bp 和 2 
[和 二 3 


加 1 英尺 =0.3048 米 。 
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对 每 个 表达 式 ， 解 释 其 操作 符 的 运算 顺序 。 上 ee 
2.30 目 行 编程 ， 实 现 将 一 些 字 符 串 显 式 转换 为 一 个 列表 的 功能 。 请 自己 组 织 文 字 语 言 ， 描 述 带 字符 
串 输 入 参数 的 列表 构造 昂 数 的 工作 原理 。 四 
2.31 本 章 讨 论 了 一 些 (但 不 是 全 部 ) 有 关 类 1ist 的 方法 。 使 用 如 下 一 系列 交互 式 命 令 作 为 帮助 ， 请 
目 己 组 织 文字 语言 ， 描 述 list 方法 extend( ) 、copy() 和 clear() 的 功能 。 


> Td ee [3 dd 
>>> lst.extend([5, 6]) 
S33> 18t 

es 

>3> 18t2 = 1at,.60py() 
>>> 18t2 
Bs 

> 19b..Cloart) 

>>% 8 


> Tat2 
i. ee | 
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本 草 我 们 将 讨论 如 何 开发 Python 程序 。Python 程序 是 按 顺 序 执行 的 Python 语句 序列 。 
为 了 根据 不 同 的 条 件 实现 不 同 的 程序 行为 ,我们 引入 了 条 件 控制 结构 和 循环 (或 迭代 ) 控制 
流 结 构 来 控制 特定 的 语句 是 否 执 行 以 及 执行 的 次 数 。 

随 看 代码 开发 量 的 增加 ， 我 们 将 注意 到 ， 我 们 会 经 党 重复 使 用 一 组 Python 语句 来 实现 
一 个 可 以 抽象 描述 的 任务 。Python 允许 开发 人 员 将 代码 封装 到 男 数 中 ， 以 便 只 使 用 一 个 函数 
调用 就 可 以 执行 代码 。 也 数 的 一 个 优点 是 代码 可 重用 性 ， 男 一 个 优点 是 可 以 简化 开发 人 员 的 
工作 :( 1) 对 开发 人 呐 隐 藏 实现 困 数 的 代码 ; (2 ) 清晰 地 阐明 代码 实现 的 抽象 任务 。 本 章 将 
介绍 如 何 定 义 Python 也 数 以 及 调用 孔 数 时 如 何 传 递 参 数 。 

本 草 所 涵盖 的 是 基本 的 程序 设计 语言 概念 ， 而 不 仅仅 是 Python 概念 。 本 章 还 将 介绍 如 
何 将 问题 分 解 为 可 以 用 Python 语句 描述 的 步骤 的 实现 过 程 。 





3.1 Python 程序 

在 第 2 革 中 ,我 们 使 用 交互 式 命 令 来 计算 Python 表达 式 的 值 ， 以 及 执行 单个 Python 语 
句 。 实 现 计算 机 应 用 程序 的 Python 程序 是 多 个 Python 语句 的 序列 。Python 语句 序列 存储 在 
开发 人 员 使 用 编辑 带 创 建 的 一 个 或 多 个 文件 中 。 


3.1.1 我 们 的 第 一 个 Python 程序 


为 了 编写 第 一 个 程序 ， 需 要 使 用 Python IDE 中 包含 的 编辑 器 。 如 何 打 开 编 辑 器 取决 
于 IDE。 例如， 如 果 你 正在 使 用 的 Python IDE 是 IDLE， 则 可 以 通过 单 击 IDLE 窗口 中 的 
【 File 】 选 项 卡 ， 然 后 单 击 【 New File 】 按 钮 ， 打 开 一 个 新 的 窗口 ， 可 以 在 这 个 新 的 窗口 中 
键 人 第 一 个 Python 程序 。 


1 linel = 'Hello Python developer...! 
line2 = 'Welcome to the world of Pythonl' 
print (linel1) 

' print (line2) 


这 个 程序 包括 四 条 语句 ， 每 行 一 条 语句 。 第 一 行 和 第 二 行 包含 赋值 语句 ; 第 三 行 和 第 四 行 
调用 print() 哨 数 。 一旦 你 键入 程序 后 ， 就 可 能 想 执 行程 序 以 观测 运行 结果 。 可 以 通过 
Python IDE 执行 程序 。 同 样 ， 执 行程 序 所 采用 的 操作 步骤 也 取决 于 你 正在 使 用 的 IDE 类 型 。 
例如 ， 如 果 你 使 用 的 Python IDE 是 IDLE， 则 可 以 直接 使 用 键盘 上 的 功能 键 【 F5 】 (或 者 用 
鼠标 单 击 IDLE 命令 窗口 中 的 【 Run 】 选 项 卡 ， 然 后 单 击 【 Run Module 】 按 钮 )。IDLE 会 
要 求 你 把 程序 保存 到 一 个 文件 中 。 注 意 Python 程序 的 文件 名 后 缀 必须 为 “ .py”。 保 存 文件 
hello.py 到 你 所 选择 的 文件 夹 中 ， 之 后 ， 程 序 将 被 执行 ， 并 在 交互 式 命令 行 中 输出 如 下 
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Hello Python developer... 
Welcome to the world of Pythonl 


Python 解释 各 从 第 一 行 到 第 四 行 依次 执行 所 有 的 语句 。 程 序 的 流程 图 如 图 3-1 所 示 。 流 程 
图 是 描述 一 个 程序 执行 流程 的 图 。 在 这 第 一 个 例子 中 ， 流 程 图 表明 四 条 语句 从 头 到 尾 依次 
执行 。 


于 


linel = 'Hello Python aeveloper | 


-一 一 


ee 


| line2 = “Welcome to the world of Python! | 


Pa ey 


(Print(line1) | 
[print Qine2) | 
ed i 
图 3-1 第 一 个 程序 的 流程 图 。 程 序 的 每 一 条 语句 位 于 各 自 的 矩形 框 中 ， 和 矩形 框 之 间 的 连接 入 
头 表 示 程 序 的 执行 流 



































注意 事项 : 重启 命令 行 
当 执 行 hello .py 时 ，Python 解释 器 在 输出 实际 结果 之 前 先 输 出 如 下 内 容 : 
>>> ======================== RESTART ========================= 


该 行内 容 表 明 Python 命令 行 被 重启 。 重 启 命 令 行 的 效果 是 清除 到 目前 为 止 命令 行 中 定义 
的 所 有 的 变量 。 这 是 必需 的 ， 因 为 程序 必须 在 空白 状态 和 默认 命令 行 环境 中 执行 。 

交互 式 命令 行 也 可 以 直接 重启 。 在 IDLE 中 ， 通 过 单 击 IDLE 窗口 中 的 【 Shell 】 选 项 
卡 ， 然 后 单 击 【 Restart Shell 】 按 钮 实现 重启 。 在 下 一 个 例子 中 ,我们 将 变量 x 赋值 为 3， 
表达 式 x 的 计算 结果 为 3 之 后 ， 重 启 了 命令 行 。 


这 > 区 
Traceback (most recent call last): 
File "<pyshell#4>", line 1, in “mnodule> 
x 
NameError: name 'x' is not defined 
>>> 


在 重启 后 的 命令 行 中 ， 注 意 x 没有 定义 ， 因 此 程序 报错 。 


应 用 程序 通常 独立 于 软件 开发 环境 (例如 IDLE) 运行 ， 所 以 了 解 如 何在 命令 行 方式 下 
运行 Python 程序 尤为 重要 。 运 行程 序 的 一 个 简单 方法 是 在 命令 行 窗口 中 运行 如 下 命令 : 
> python hello.py 


Hello Python developer... 
Welcome to the world of Python! 
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(注意 ， 请 确保 在 包含 Python 程序 的 文件 夹 下 运行 该 程序 。) ， 


知识 拓展 : 编辑 器 
类 似 于 微软 Word 的 编辑 器 并 不 适合 编写 和 编辑 程序 。 程 序 员 专用 的 编辑 器 应 该 包含 
有 助 于 提高 程序 开发 过 程 效 率 的 工具 。 这 类 软件 开发 环境 称 为 集成 开发 环境 (IDE)。 
适合 于 开发 Python 程序 的 IDE 有 很 多 种 。 它 们 都 包含 有 助 于 Python 编程 的 功能 ， 包 
括 自动 缩 进 、 在 编辑 器 中 运行 /调试 Python 代码、 快速 访问 Python 标准 库 等 。 三 种 流行 的 
集成 开发 环境 为 : IDLE (包含 在 Python 开发 工具 包 中 )、Komodo 和 PyDev with Eclipse。 


3.1.2 Python 模块 


我 们 创建 并 保存 的 hello .py 文件 就 是 用 户 自 定 义 Python 模块 的 一 个 例子 。 在 第 2 章 
中 ,我 们 使 用 术语 模块 来 描述 内 置 的 标准 库 组 件 math、fractions 和 turtle。 这 些 是 
内 置 Python 模块 。 那 么 ，hello.py 和 Python 内 置 模块 之 间 有 什么 共同 点 呢 ? 

人 简 而 言 之 ， 模 块 是 包含 Python 代码 的 文件 。 任 何 一 个 包含 Python 代码 且 后 级 为 .py 的 
文件 就 是 一 个 Python 模块 。 我 们 创建 的 文件 hello .py 是 一 个 模块 ， 你 的 电脑 中 的 某 个 文 
件 夹 下 用 于 实现 对 应 标准 库 组 件 的 文件 math.py、fractions.py 和 turtle.py 等 , 也 
是 Python 模块 。 

显然 ， 模块 中 的 代码 是 用 来 执行 的 。 例 如 ， 当 通过 按 下 功能 键 【 F5 】 执 行 hello.py 
时 ,模块 中 的 代码 会 被 从 开始 到 结尾 执行 。 当 我 们 针对 一 个 模块 (例如 ,math 或 turtle) 
执行 一 条 import 语句 时 ， 结 果 等 同 于 按 下 【 FS 】( 当然 这 种 图 述 并 不 精确 ， 我 们 将 在 第 7 
草 进 一 步 曾 述 )。 当 执行 

>>> import math 


时 ,文件 math .py 中 的 代码 会 被 执行 。 其 中 的 代码 恰好 是 定义 一 系列 的 数学 函数 。 


3.1.3 ”内 置 函数 print() 
我 们 的 第 一 个 程序 包含 两 行使 用 函数 print( ) 的 代码 。 这 个 函数 在 交互 式 命令 行 输出 
所 传人 的 参数 。 例 如 ， 如 果 传 和 人 一 个 数值 ， 则 输出 该 数值 : 


>>> Print(0O) 
0 


同样 ， 如 果 传 人 一 个 列表 ， 则 输出 该 列表 : 


>>> print( [0; 0 9]) 
LW 


一 个 字符 串 参 数 输出 为 不 带 引 号 的 字符 串 : 


>>> print('zero') 


Zero 

如 有 果 输 入 参数 包含 一 个 表达 式 ， 则 先 对 该 表达 式 求 值 ， 然 后 输出 计算 结果 : 
二 

>>> print (x) 

0 


注意 ,在 我 们 的 第 一 个 程序 中 ， 每 一 条 print() 语句 在 单独 的 行 中 输出 其 参数 。 
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3.1.4 使 用 input() 函数 实现 交互 式 输入 

程序 执行 时 常常 需要 与 用 户 进行 交互 。 函 数 input ( ) 可 以 实现 该 功能 。 该 函数 通常 位 
于 赋值 语句 的 右 侧 ， 例 如 

>>> XxX = input('Enter your first name: E 


当 Python 执行 这 个 input ( ) 图 数 时 ， 将 首先 在 命令 行 输出 该 函数 的 输入 参数 ( 即 字 符 


刷 “Enter your first name: ) 





Enter your first name: 
然后 中 断 程 序 的 运行 ， 并 等 待 用 户 在 键盘 上 键 人 内容 。 输 出 的 字符 串 “ Enter your 
first name:” 实 际 上 是 提示 内 容 。 当 用 户 键 入 内 容 ， 并 按键 盘 上 的 【 Enter/Return 】 键 
后 ,程序 将 继续 运行 ， 而 用 户 键 入 的 任何 内 容 则 会 赋值 给 变量 name: 


>>> name = input('Enter your first name: 二 
Enter your first name: Ljubomir 

>>> name 

-了 OO 孙 2 


注意 ， 对 用 户 键入 的 所 有 内 容 ，Python 都 作为 一 个 字符 串 来 处 理 (例如 ， 本 例 中 的 
五 本 问世 Gd 

input() 吨 数 一 般 在 程序 中 使 用 。 我 们 将 在 如 下 更 为 人 性 化 的 问候 程序 ( hello.py) 
中 说 明 其 使 用 方法 。 下 一 个 程序 请 求 用 户 输入 他 的 名 和 姓 ， 然 后 在 屏幕 上 输出 人 性 化 的 问 
候 语 。 


first = input('Enter your first name: ') 


last = input('Enter your last name.: !) 
Linel 二 ‘ReillJeo "tT first 二 ， 《二 ]ast 二 " 
print (linel) 


print('Welcome to the world of python!') 


当 我 们 运行 该 程序 时 ,前 先 执行 第 一 行 语句 ， 输 出 信息 “Enter your first 
name :”， 然 后 中 断 程 序 的 执行 ， 等 每 直到 用 户 使 用 键盘 键入 内 容 并 按 【 Enter/Return 】 键 。 
用 户 输入 的 所 有 内 容 将 被 赋值 给 变量 first。 第 二 行 语句 与 第 一 行 类 似 。 在 第 三 行 ， 使 用 
字符 串 拼 接 来 创建 问候 语 字 符 串 ， 并 在 第 四 行 输出 。 程 序 的 运行 示例 如 下 所 示 : 

SD 

Enter your first name: Ljubomir 

Enter your last name: Perkovic 


Hello Lijubomir Perkovic... 
Welcome to the world of Pythonl 


注意 事项 : input() 函数 返回 字符 串 
如 上 所 述 ， 调 用 input() 函数 时 ， 用 户 键入 的 所 有 内 容 将 作为 字符 串 处 理 。 我 们 观 
察 一 下 当 用 户 键入 数值 时 的 情况 : 
>>> x = input('Enter a value for x: ') 
Enter a value for x: 5 


洋 之 > 这 


| 
ww) 


Python 解释 器 把 该 值 视 为 字符 串 '5' ， 而 不 是 整数 5。 验 证 如 下 : 
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>>> x == 5 
False 

>>> x == '5' 
True 


input() 函数 总 是 把 用 户 输入 的 所 有 内 容 作 为 字符 串 来 处 理 。 


3.1.5 evalL() 函数 


如 果 期 望 用 户 输入 非 字 符 串 值 ， 则 需要 明确 指示 Python 使 用 男 数 eval( ) 将 用 户 输 入 
的 内 容 作 为 一 个 Python 表达 式 来 求 什 。 

eval( ) 困 数 带 一 个 字符 串 输入 参数 ， 并 且 把 该 字符 串 作 为 一 个 Python 表达 式 来 求 值 。 
下 面 是 一 些 示例 : 


>>> eval( "3°) 
3 # 
>>> eval('3 + 4')) 

7 

yo Bralt liomtts, a TFT, 91 
4 


当 我 们 期 望 用 户 按 要 求 输入 一 个 表达 式 (数值 、 列 表 ， 等 等 ) 时 ， 可 以 把 函数 eval () 
和 函数 input( ) 结合 在 一 起 使 用 。 只 需要 在 input() 函数 之 上 调用 eval() 函数 即 可 ， 
其 效果 是 将 用 户 输入 的 内 容 作 为 一 一 个 表达 式 来 求 值 。 例如 ， 下 面 例子 可 以 保证 用 户 输入 的 数 
值 被 作为 数值 来 处 理 : 


>>> x = eval(input('Enter x: ')) 
Enter ZT 5 


我 们 可 以 验证 x 是 数值 ， 而 不 是 字符 串 : 


>>> x == 5 

True 

之 2 5 

False 

;这 3 了 潮 蜂 ” 编 写 一 个 程序 ， 实 现 如 下 功能 : 要 求 用 户 输入 一 个 华 色 温度， 使 用 如 下 


公式 转换 输出 其 摄氏 温度 : 
celsius = 2 (fahrenheit — 32) 


程序 的 运行 结果 如 下 所 示 : 


>>> 
Enter the temperature in degrees Fahrenheit: 50 
The temperature in degrees Celsius is 10.0 


3.2 执行 控制 结构 


Python 程序 是 一 系列 连续 执行 的 语句 。 迄 今 为 止 ， 在 我 们 所 涉及 的 简短 程序 中 ， 不 管 
用 户 输入 什么 值 (如 果 有 的 话 )， 总 是 从 第 一 行 语句 开始 执行 相同 的 语句 序列 。 实 际 上 ， 在 
计算 机 上 使 用 应 用 程序 的 情况 并 非 总 是 如 此 。 计 算 机 应 用 程序 通常 会 根据 输入 值 来 做 不 同 的 
事情 。 例 如 ， 玩 完 一 局 游戏 后 ， 根 据 用 户 单 击 【 Exit ] 或 者 【 Play Again ] 按钮 ， 游 戏 可 能 


48 子 半 


3 


停止 或 者 继续 运行 。 接 下 来 ,我 们 将 介绍 一 些 Python 语句， 这 些 语句 可 以 控制 执行 不 同 的 
语句 以 及 重复 执行 语句 。 


3.2.1 单 分 支 结构 


假设 我 们 打算 开发 一 个 程序 ， 要求 用 户 输 入 当前 温度 ,然后 在 超过 86 度 的 情况 下 输出 
适当 的 信息 。 如 果 用 户 输入 87， 该 程序 的 运行 结果 为 : 

>>> 

Enter the current temperature: 87 


It is hott 
Be sure to drink liquids. 


如 果 用 户 输入 67， 则 该 程序 的 运行 结果 为 : 
>>> 
Enter the current temperature: 67 


换言之 ， 如 果 温 度 为 86 或 更 低 ， 则 不 输出 任何 信息 。 如 果 温 度 高 于 86 度 ， 则 输出 如 下 
信息 : 


it is hot! 
Be sure to drink liquids. 


要 实现 所 描述 的 行为 ( 即 代 码 片 段 的 条 件 执 行 );， 必 须 有 一 种 方法 根据 条 件 来 控制 是 否 
执行 一 段 代 码 。 如 果 条 件 为 真 ， 则 执行 代码 片段 ;否则 不 执行 。 
if 语句 用 来 实现 条 件 执行 。 使 用 if 语句 实现 预期 的 程序 的 代码 如 下 所 示 : 
模块 : oneWay.py 


temp = eval(input('Enter the current temperature: 了 
if temp > 86: 

和 

print('Be sure to drink liquids.') 


(注意 : 使 用 空白 行 的 目的 是 增加 程序 的 可 读 性 。) if 语句 包含 程序 中 的 第 三 行 到 第 五 行 。 在 
第 三 行 ，if 关键 字 后 面 是 条 件 “temp > 86”。 如 果 条 件 表达 式 的 计算 结果 为 rrue， 则 
第 三 行 下 面 的 缩 进 语句 将 会 被 执行 ; 如 果 条 件 “ temp > 86” 的 计算 结果 为 False， 则 不 
执行 这 些 缩 进 语句 。 图 3-2 描述 了 程序 的 两 条 执行 流 分 文 (使 用 虚线 )。 

现在 假设 我 们 需要 为 程序 增加 一 个 功能 : 不 管用 户 输入 的 温度 高 低 ， 程 序 结束 前 输出 
“Goodbye !”。 程序 的 运行 效果 如 下 所 示 : 

>>> 

Enter the current temperature: 87 

tT 1s hot 


Be sure to drink liquids. 
Goodbye. 


或 者 如 下 所 示 : 
>>> 


Enter the current temperature: 67 
Goodbye. 
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图 3-2 单 分 支 程序 (oneWay .py) 的 流程 图 。 首 先 执 行 input ( ) 语句 ， 然 后 将 用 户 所 输入 
的 值 赋值 给 变量 temp。 使 用 if 语句 检查 条 件 “ temp > 86”。 如 果 条 件 为 真 . 则 执 
行 两 条 print() 语句 ， 并 结束 程序 ; 如 果 条 件 为 假 ， 则 直接 结束 程序 


执行 if£ 语句 之 后 需要 执行 print('Goodbye' )。 这 意味 着 print('Goodbye' ) 语 
名 在 程序 中 的 位 置 必 须 符合 :( 1 ) 位 于 缩 进 的 if 语句 块 之 后 ; (2 ) 与 if 语句 的 第 一 行 的 
缩 进 相同 。 


模块 : oneWay2.py 


temp = eval(input('Enter the current temperature: ')) 


一 一 -一 -一 -一 - - 一 -一 一 ---- 一 一 -一 一 


if temp > 86: 
princt'It 3s hot!®) 
Print('Be Sure to drink 11g9u1ids. ) 


print('Goodbye.") 





执行 完 第 三 行 语句 后 ， 可 能 执行 缩 进 的 语句 块 (第 四 行 和 第 五 行 )， 也 可 能 不 执行 。 无 
论 何 种 情况 ,程序 将 继续 执行 第 七 行 的 语句 。 程 序 oneWay2 .py 对 应 的 流程 图 如 图 3-3 
所 示 。 

一 般 来 说 ，if 语句 的 格式 如 下 : 

if < 条 件 >: 

< 编 进 语句 块 > 

< 非 缩 进 语句 > 
if 语句 的 第 一 行 包含 if 关键 字 ， 紧 接着 是 < 条 件 > 布 尔 表 达 式 ( 即 计算 结果 为 True 或 
False 的 表达 式 )， 然 后 是 一 个 英文 冒号 (用 于 指示 条 件 结束 )。 第 一 行 之 后 是 相对 于 if 关 
键 字 的 缩 进 语句 块 ， 当 < 条 件 > 表达 式 计算 结果 为 True 时 ， 将 被 执行 。 

如 果 < 条件 > 表达 式 计 算 结 果 为 False， 则 跳 过 缩 进 代码 块 。 无 论 哪 种 情况 ， 不管 缩 
进 代 码 是 否 被 执行 ， 将 继续 执行 紧 接 厦 下 面 的 与 if 语句 第 一 行 缩 进 相同 的 Python 语句 
< 非 缩 进 语句 >。 
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图 3-3 单 分 文 程序 (oneway2.pPY) 的 流程 图 。 与 if 语句 的 条 件 是 真 或 假 无 关 ， 执行 if 语 
名 之 后 ,语句 print('Goodbye.' ) 都 会 被 执行 


注意 事项 : 关于 缩 进 
在 Python 语言 中 ，Python 语句 的 正确 缩 进 非常 关键 。 请 比较 : 
代码 片段 1: 
if temp > 86: 


print('Its hot!") 
print('Be sure to drink liquids.') 


print('Goodbye.') 


和 代码 片段 2: 
if temp > 86: 
print('It is hot!') 
print('Be sure to drink liquids.') 
print('Goodbye.') 
在 代码 片段 1 中 , 语句 print('Goodbye.') 的 缩 进 与 if 语句 的 第 一 行 相同 。 因 
此 ， 该 语句 将 在 if 语句 执行 后 被 执行 ， 与 if 语句 中 的 条 件 是 真 或 假 无 关 。 
在 代码 片段 2 中 ,语句 print('Goodbye.') 相对 于 if 语 句 的 第 一 行 缩 进 ， 因 
此 ， 该 语句 是 if 缩 进 语句 块 的 一 部 分 ， 仅 当 if 条 件 为 真 时 才 会 被 执行 。 


把 下 列 条 件 语句 翻译 成 Python 语言 的 if 语句 : 

(a) 如 果 age 大 于 62， 则 输出 “You can get your pension benefits” 

(b) 如 果 name 包含 在 列表 ['Musial'， 'Aaraon', 'Williams', 'Gehrig',， 
'Ruth'] 中 ， 则 输出 “one of the top 5 baseball players, ever!” 

(c) 如 果 hits 多 于 10 并 且 shield 为 0， 则 输出 “You are dead...” 
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(d) 如 果 布 尔 变量 north、south、east 和 wes 七 至 少 有 一 个 为 rue， 则 输出 “I 


can escape.”, 


3.2.2 ” 双 分 文 结构 


在 单 分 文 if 语句 结构 中 ， 仅 当 条 件 为 真 才 执行 动作 。 然 后 ， 无 论 条 件 是 真 或 假 ， 继 续 
执行 if£ 语句 后 面 的 语句 。 换 言 之 ， 当 条 件 为 假 时 ,没有 执行 任何 特殊 操作 。 

然而 ， 有 时 候 这 并 不 是 我 们 所 期 望 的 结果 。 我 们 也 许 希 望 当 条 件 为 真 时 执行 一 种 操作 ， 
而 当 条 件 为 假 时 执行 男 一 种 操作 。 继 续 使 用 温度 示例 ， 假 设 我 们 希望 温度 不 大 于 86 时 输出 
另 一 条 消息 。 我 们 可 以 使 用 if 语句 的 新 版 本 (使 用 else 子 句 的 版 本 ) 来 实现 这 种 行为 。 
我 们 使 用 程序 twoWay .py 进行 说 明 。 


模块 : twoWay.py 
temp = eval(input('Enter the current temperature: ')) 
if temp > 86: 


print (It is hot!'!:) 
print('Be sure to drink liquids.') 


else: 


primgb (‘it is 0t hot.') 
print('Bring a jacket. ') 


E print('Goodbye.') 


当 程 序 的 第 三 行 被 执行 时 ， 有 两 种 情况 。 如 果 temp 的 值 大 于 86， 则 执行 如 下 缩 进 语 
句 块 : 


DFI Tt ig GE 
print('Be sure to drink liquids.') 


当 temp 不 大 于 86 时 ， 则 执行 else 下 面 的 缩 进 语句 块 : 


DFI ‘Et js Ot ot .+ ) 
print('Bring a jacket.') 


在 两 种 情况 下 ， 程 序 都 将 继续 执行 后 续 与 i£f/else 缩 进 相同 的 语句 〈 即 第 13 行 语句 )。 
摘 述 两 种 执行 流 分 文 的 流程 图 如 图 3-4 所 示 。 
if 语句 更 一 般 的 语法 形式 如 下 : 
if < 条件 >: 
< 缩 进 代码 块 1> 
else: 
< 缩 进 代码 块 2> 
< 非 缩 进 语句 > 
当 < 条 件 > 计算 结果 为 True 时 ， 则 执行 < 缩 进 代码 块 1> ; 当 < 条件 > 计算 结果 为 False 
时 ， 则 执行 < 缩 进 代码 块 2>。 执 行 完 任 意 缩 进 代码 块 之 后 ， 程 序 继 续 执行 < 非 缩 进 语句 >。 





一 J 
temp = input('Enter the current temperature: ') | 
4 
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| print ('Goodbye. 





图 3-4” 双 分 支 程 序 ( twoWay .py) 的 流程 图 。 如 果 条 件 temp > 86 为 真 ， FI£ 增色 
的 语句 块 ， 如 果 为 假 ， 则 执行 else 语句 的 语句 块 。 在 两 种 情况 下 ， 执行 完 if/else 
语句 块 后 ， 程 序 都 会 继续 执行 后 面 的 语句 


把 下 列 条 件 语句 翻译 成 Python 话 言 的 if/else 语句 : 

(a) 如 果 year 能 够 被 4 整除 ， 则 输出 “could be a leap year 
“Definitely not a leap year. 

(b) 如 果 列 表 tijcket 等 于 列表 lottery， 则 输出 “You won!”; 否则 ,输出 “Better 
luck next 七 Ime… 


。 ; 否则 ， 输 出 


多 编写 Python 程序 ， 首 先 要 求 用 户 输入 登录 ID( 即 一 个 字符 串 )。 然 
后 ， 程 序 检测 用 户 输入 的 ID 是 否 位 于 表示 有 效用 户 的 列表 ['joe'， 'sue'， 'hani'， 
oe 如 果 是 有 效 的 用 户 ， 则 输出 适当 的 提示 信息 。 无 论 是 否 为 有 效用 户 ， 均 在 
输出 “Done.” 后 程序 结束 执行 。 例 如， 以 下 是 一 个 成 功 登 录 的 示例 : 

>>> 

Login: joe 

You are nl 


Done . 

未 成 功 登 录 的 示例 则 如 下 : 
>>> 

Login: john 

User unknown. 

Done. 


3.2.3 ”循环 结构 


在 第 2 章 中 ， 我 们 介绍 了 字符 串 和 列表 。 两 者 都 是 对 象 序列 。 字 符 串 可 以 被 视 为 字符 的 
序列 ; 列表 是 任何 类 型 (字符 串 、 数 值 甚至 其 他 列表 ) 的 对 象 的 序列 。 所 有 序列 的 一 个 共同 
任务 是 对 序列 中 的 每 个 对 象 执 行 同 一 操作 。 例 如 ， 通 过 联系 人 列表 ， 可 以 回 附近 的 联系 人 发 
送 聚 会 邀请 ; 或 者 ， 通 过 一 个 购物 清单 列表 来 检查 你 购买 的 东西 ; 再 或 者 ， 读 入 一 串 表 示 姓 


命令 式 编 娠 53 


名 的 字符 并 按 单个 字母 来 拼写 姓名 。 

我 们 使 用 上 述 最 后 一 个 例子 作为 程序 示例 。 假 设 我 们 想 实现 一 个 简短 的 程序 ， 逐 个 输出 
用 户 输入 的 字符 串 中 所 包含 的 每 个 字符 : 

>>> 

Enter a word: Lena 

The word spelled out: 

EE 


程序 首先 要 求 用 户 输入 一 个 字符 串 。 然 后 输出 “The word spelled out:”， 随 后 
隶 行 输出 用 户 输入 的 字符 串 中 包含 的 每 个 字符 。 程 序 的 实现 可 以 从 如 下 两 行 语句 开始 : 

name = input('Enter aA WOrd: ") 

print('The word spelled out:") 


为 了 实现 该 程序 /我 们 需要 一 种 方法 ， 人 允许 针对 字符 串 变量 name 中 包含 的 每 一 个 字符 
执行 一 次 print() 语句 。Python 语言 的 for 循环 语句 可 以 用 来 完成 这 个 任务 。 实 现 该 功 
能 的 程序 如 下 所 示 : 


模块 : spelling.py 
name = input('Enter a word: ') 


print('The word spelled out: ') 


for char in name: 
print (char) 


for 循环 语句 包含 程序 的 第 四 行 和 第 五 行 。 在 第 四 行 中 ，char 是 一 个 变量 名 。for 循 
环 语句 将 把 字符 串 变 量 name 中 包含 的 每 个 字符 依次 赋值 给 变量 char。 假 如 name 是 字符 
串 'Lena'， 则 char 首先 被 赋值 为 'L' ， 然 后 是 'e' 、'n'， 最 后 为 'a' 。 针 对 char 的 每 
个 值 ， 将 执行 缩 进 的 print 语句 “print(char)”。 图 3-5 描述 了 该 循环 的 工作 原理 。 


a L e n a 
第 一 次 友 代 : char = GB 1 
第 二 次 迭代 ; char = 时 
第 三 次 欠 代 : char = | n | 
第 四 次 迭代 : char = a | 


图 3-5 一 个 字符 串 的 迭代 过 程 。 在 第 一 次 迭代 中 ， 变 量 char 被 赋值 为 'L' ; 第 二 次 迭代 中 ， 
变量 char 被 赋值 为 'e' ; 第 三 次 迭代 中 ， 变 量 char 被 赋值 为 'n' ; 第 四 次 迭代 中 ， 
变量 char 被 赋值 为 'a' 。 每 次 迭代 过 程 中 ,输出 变量 char 的 当前 值 。 因 此 ， 当 
char 为 'L' 时 输出 'L' ， 当 char 为 'e' 时 输出 'e' ， 以 此 类 推 
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for 循环 语句 还 可 以 用 来 迁 代 一 个 列表 中 的 项 目 。 在 下 一 个 示例 中 ， 我 们 在 交互 式 命令 
行 中 ,使 用 一 个 for 循环 语句 迁 代 表示 宠物 的 字符 串 对 象 


> anivals = :ES "cat', 'dog '] 
>>> Tor aninmal 1n animals: 
print (animal) 


fish 
Cat 


dog 


for 循环 语句 执行 缩 进 代码 “print(animal)” 三 次 ， 即 针对 animal 的 每 一 个 值 执 
行 一 次 。animal 的 值 首 先 为 'fish' ， 然后 是 'cat' ， 最 后 是 'dog'。 其 示意 如 图 3-6 
所 示 。 


animals 
第 一 次 迭代 : animal = 
第 二 次 闪 代 : animal = 


第 三 次 迭代 ; animal = 





图 3-6 一 个 列表 的 迭代 过 程 。 在 第 一 次 迭代 中 ， 变 量 animal 被 赋值 为 'fish' ; 第 二 次 过 
代 赋 值 为 “cat'; 第 三 次 迭代 赋值 为 'dog' 。 每 次 迭代 过 程 中 ， 输 出 animal 的 值 


注意 事项 : for 循环 语句 的 变量 
假设 有 如 下 两 个 for 循环 语句 : 
for char in name: 


print (char) 


for animal in animals: 
print (animal) 


上 述 两 个 for 循环 语句 中 的 变量 name 和 animal 均 为 变量 名 称 (建议 变量 选用 有 
意义 的 命名 方式 ， 以 增加 程序 的 可 读 性 )。 当 然 ， 我 们 也 可 以 简单 使 用 变量 X 来 书写 for 
循环 语句 : 


for X in name: 
print (x) 


for x in aninals: 
print (x) 


注意 : 如 果 更 改 了 for 循环 语句 的 变量 名 ， 则 for 循环 语句 体 中 所 有 使 用 该 变量 的 
地 方 也 应 该 修改 。 


一 般 来 说 ，for 语句 的 语法 形式 如 下 : 
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for “变量 > in < 序列 >: 
< 缩 进 代码 块 > 

< 非 缩 进 代 码 块 > 

for 循环 语句 依次 按照 从 左 到 右 的 顺序 把 < 序列 > 中 的 对 象 赋值 给 < 变量 >。< 缩 进 
代码 块 > 通常 被 称 为 for 循环 语句 体 ， 将 针对 < 变量 > 的 每 一 个 值 执行 一 次 。 也 就 是 说 ， 
for 循环 语句 迭代 序列 中 的 对 象 。 依 次 执行 完 < 缩 进 代 码 块 > 后 ， 程 序 继续 执行 for 循环 
语句 后 的 < 非 缩 进 代 码 块 >。< 非 缩 进 代码 块 > 位 于 for 循环 语句 之 后 ， 且 与 for 循环 语 
名 的 第 一 行 代码 缩 进 相同 。 


3.2.4 ”内 套 的 控制 流 结构 

接 下 来 我 们 编写 一 个 结合 for 循环 语句 和 if 语句 的 程序 。 程 序 首先 提示 用 户 输入 一 个 
短语 。 用 户 输入 一 个 短语 后 ， 程 序 将 输出 短语 中 所 有 的 元 音字 母 ， 但 不 输出 其 他 字母 。 程 序 
的 运行 结果 如 下 所 示 : 

>>> 

Enter a phrase: test case 


a 
e 


该 程序 将 包含 右 干 成 分 : 使 用 一 个 input ( ) 语句 读 取 短 语 ; 使 用 一 个 for 循环 语句 迭代 输 
入 字符 串 中 的 字母 ; 在 for 循环 语句 的 每 次 迭代 过 程 中 ,使 用 一 个 i£ 语句 判断 当前 字符 是 
否 为 元 音字 母 ， 如 果 是 ， 则 输出 。 完 整 的 程序 如 下 所 示 : 


模块 : for.py 


' phrase = input('Enter a phrase: ') 


for c¢ in phrase: 
if ¢ in 'aeoiuAEIOU': 
print(c) 


注意 ， 我 们 把 一 个 for 循环 语句 和 一 个 if 语句 结合 在 一 起 ， 不 同 的 缩 进 指定 不 同 的 语 
句 体 。if 语句 体 仅 包含 print(c) 语句 ， 而 for 循环 语句 体 则 包括 : 


OABTOU: 
Print(c) 


s; 吉 3 轩 时 革 四” 编写 一 个 程序 ， 提示 用 户 输入 一 个 单词 ( 即 字符 串 ) 列表 ， 然 后 在 屏幕 上 
输出 所 有 四 个 字母 的 单词 ， 每 个 单词 单独 占 一 行 。 例 如 : 

>>> 

Enter Word list: [Listopi ‘desktop',s ‘top's ‘poat') 

stop 

post 


3.2.5 range() 函数 


前 面 阐述 了 使 用 for 循环 语句 和 欠 代 列表 中 的 各 项 元 素 或 者 字符 串 的 每 个 字符 。 尽 管 没 
有 显 式 给 出 一 个 数值 列表 ， 但 我 们 经 常 需 要 针对 给 定 范 围 的 数值 序列 进行 迭代 。 例 如 ， 可 能 
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需要 查找 一 个 数值 的 每 个 因子 ， 或 者 迭代 一 个 序列 对 象 的 索引 0，1，2，…。 结 合 内 置 男 数 
range() 和 for 循环 语句 ， 可 以 实现 在 给 定 范 围 的 数值 序列 上 进行 只 代 。 如 下 所 示 ， 在 整 
上 


>>> for i in range(5) : 
print (i) 


PO 


range(n) 国 数 通常 用 来 在 整数 序列 0，1，2，…，1H-1 上 迭代。 在 上 一 个 例子 中 ， 第 
一 次 迭代 中 变量 i 被 赋值 为 0， 在 接 下 来 的 迭代 中 ，i 依次 被 赋值 为 1、2、3， 最 后 是 4 ( 当 
n=5 时 )。 针 对 i 的 每 个 值 ， 每 次 迭代 将 执行 for 循环 语句 的 缩 进 代码 块 。 

在 交互 式 命令 行 中 ， 编 写 一 个 for 循 玩 语 句 ， 输 出 下 列 数值 序列 ， 每 个 
数值 单独 占 一 行 : 

(a) 从 各 到 9 的 整数 { 即 0、1、2、3、4、5、 6、 7 8 9)。 

(b) 从 0 到 1 的 整数 ( 即 0、1 )。 


range() 电 数 还 可 以 用 来 迭代 更 加 复杂 的 数值 序列 。 假 如 我 们 希望 序列 从 非 零 数值 
start 开始 ， 在 数值 end 前 结束 ， 则 可 以 通过 轴 数 调用 range(start， end) 实现 。 例 
如 ， 如 下 for 循环 语句 在 序列 2、3、4 上 和 迭代 。 


>>> for i in range(2，5) : 
print (i) 


心 CD DD 


为 了 产生 步 长 不 等 于 1 的 序列 ， 可 以 使 用 第 三 个 参数 。 图 数 调用 zange(start， 
end， step) 可 以 用 来 迭代 从 start 开始 ， 步 长 为 step， 在 end 前 结束 的 整数 序列 。 例 
如 ， 以 下 循环 语句 迭代 序列 1]、4、7、10、13: 

> For 1 Tn Taongal(l, 14, 3 

print (i) 
for 循环 语句 输出 的 序列 从 1 开始 ， 步 长 为 3， 在 14 之 前 结束 。 因 此 ， 程 序 输出 1、4、7、 
10 和 13。 


编写 for 循环 语句 ， 输 出 如 下 数值 序列 ， 每 个 数值 单独 占 一 行 : 

(a) 从 3 到 12 (包括 ) 的 整数 。 

(b) 从 0 到 9 (不 包括 ) 的 整数 ， 步 长 为 2 (而 不 是 默认 值 1 )， 即 结果 为 0、2、4、6、8。 
(c) 从 0 到 24 (不 包括 ) 的 整数 ， 步 长 为 3。 

(d) 从 3 到 12 (不 包括 ) 的 整数 ， 步 长 为 5。 
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3.3 ”用 尸 自 定义 涵 数 


如 ， 


我 们 已 经 接触 并 使 用 了 若干 Python 内 置 国 数 。 例 如 ， 表 数 len() 接收 一 个 序列 ( 例 


一 个 字符 串 或 者 列表 ) 作为 输入 ， 然 后 返回 序列 中 项 的 个 数 : 
> Len('golafish’,) 

8 

> len(l'eoldficsh!, i'cat!:, dog 'j) 

二 


呆 数 max( ) 可 以 接收 两 个 数值 作为 输入 ， 返 回 其 中 的 最 大 值 : 


> max( 7) 
7 


明 数 sum( ) 可 以 接收 一 个 数值 列表 作为 输入 ， 返 回 这 些 数值 的 和 : 


> Bm([4, 5 6 7]» 
2 


一 些 函 数 可 以 直接 调用 而 无 须 参 数 ， 例 如 : 
>>> print() 


一 般 而 言 ， 一 个 盟 数 接收 零 个 或 者 多 个 输入 参数 ， 并 返回 一 个 结果 。 图 数 的 优点 之 一 是 


可 以 通过 单行 语句 进行 调用 来 完成 实际 上 需要 多 行 Python 语句 来 完成 的 任务 。 更 加 突出 的 
优点 是 ， 通常 使 用 隐 数 的 开发 人 员 并 不 需要 知道 函数 的 实现 语句。 由 于 开发 人 员 无 须知 道 滑 
数 的 实现 原理 ， 所 以 函数 可 以 简化 程序 开发 过 程 。 基 于 上 述 原因 ，Python 和 其 他 程序 设计 语 
言 均 允 许 开 发 人 员 定 义 日 已 的 清 数 。 


3.3.1 我 们 自 定义 的 第 一 个 函数 


我 们 将 通过 开发 一 个 命名 为 上 、 带 一 个 数值 x 作 为 输入 参数 、 计 算 并 返回 zx + 1 的 


Python 毅 数 来 前 述 Python 语言 中 如 何 定义 曙 数 。 该 师 数 的 运行 结 末 如 下 所 示 : 


>>> £(9) 

82 

> 9 xk (9) 和 
34 


吸 数 £( ) 可 以 在 一 个 Python 模块 中 定义 如 下 : 


模块 : ch3.py 


def f(x): 
res = x**2 十 1 
return res 


如 果 要 使 用 函数 E() (例如 计算 f(3) 或 £(9))， 必 须 先 运行 包含 该 函数 定义 的 模块 
(例如 ， 按 功能 键 【 F5 】))。 当 了 匈 数 定义 语句 被 执行 之 后 ， 就 可 以 使 用 陋 数 £( )。 


也 可 以 直接 在 交互 式 命令 行 中 按 如 下 方式 定义 函数 £( ): 


S35 Hef f(x 
res = Xx**2 + 1 
return res 


一 旦 定义 了 函数 £( )， 就 可 以 像 使 用 其 他 内 置 陆 数 一 样 使 用 它 。 
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Python 网 数 定 义 语句 的 一 般 格式 如 下 : 

def < 函数 名 称 > (<0 个 或 多 个 变量 >) 
< 缩 进 函数 体 > 

图 数 定 义 语句 从 关键 字 def 开始 ， 紧 接着 是 郴 数 的 名 称 。 在 上 例 中 ， 顶 数 名 是 夺 。 辑 
数 名 之 后 括号 中 是 输入 参数 的 位 置 ， 如 果 有 输入 参数 的 话 。 在 函数 E() 中 ,x 在 

def f(x): 

中 的 作用 与 数学 也 数 ftx) 相同 ， 均 用 作 输 入 值 的 名 称 。 

中 数 定义 的 第 一 行 以 英文 冒号 结束 ,下面 的 缩 进 部 分 是 也 数 体 ， 即 实现 也 数 的 语句 序 
列 。 当 调用 吧 数 时 ,执行 函 数 体 语句 。 如 果 一 个 函数 有 返回 值 ， 则 使 用 return 语句 指定 
要 返回 的 值 。 在 上 例 中 ， 函 数 体 返回 变量 res 的 值 。 当 执行 return 语句 后 ， 或 者 困 数 体 
的 最 后 一 条 语句 执行 后 ， 田 数 执行 结束 。 


了 有 : 届 在 交互 式 命 令 行 中 直接 定义 一 个 函数 perimeter()， 带 一 个 输入 参 
数 一 一 圆 的 半径 ( 非 负 数值 )， 要 求 返 回 圆 的 周 长 。 运 行 示例 如 下 所 示 : 


>>> perimeter(1) 
6.283185307179586 
>>> perimeter (2) 
12.566370614359172 


注意 ， 程 序 需 要 使 用 圆周 率 (在 模块 math 中 定义 ) 来 计算 周 长 。 


3.3.2 ”函数 输入 参数 


如 果 哨 数 £( ) 定义 为 市 一 个 输入 参数 ， 则 可 以 使 用 变量 x 作为 引用 输入 参数 的 变量 名 称 。 
如 有 果 要 定义 一 个 市 多 个 参数 的 函数 ， 则 需要 为 每 一 个 输入 参数 指定 一 个 不 同 的 变量 名 称 。 

例如 ， 需 要 定义 一 个 名 为 squareSum( ) 的 函数 ， 带 两 个 数值 x 和 了 作为 输入 参数 ， 并 
上 且 返回 它们 的 平方 和 x + y。 则 我 们 需要 定义 浮 数 squaresum( ) ， 一 个 变量 名 (例如 x) 
引用 输入 参数 x， 男 一 个 变量 名 (例如 y) 引用 输入 参数 y: 


模块 : ch3.py 


' def squareSum(x, y): 
return xXx**2 + y**2 


(注意 ， 本 例 仅 仅 使 用 了 一 条 return 语句 来 实现 困 数 squareSum( ) 的 功能 ， 而 上 例 £() 
的 实现 则 使 用 了 额外 的 赋值 语句 。) 


证 届 实现 函数 average()， 囊 两 个 数值 作为 输入 参数 ， 要 求 返 回 它们 的 平均 
值 。 请 在 一 个 命名 为 average .py 的 模块 中 编写 该 函数 。 函 数 使 用 示例 结果 如 下 : 


>>> average(1,3) 
a 

>>> average(2，3.5) 
,5 


目前 为 止 ， 我们 定义 的 孔 数 均 使 用 一 个 或 多 个 数值 作为 输入 参数 。 当 然 ， 函 数 也 可 以 市 
其 他 类 型 的 输入 参数 ， 包 括 字 符 串 和 列表 。 
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呈 事 3 本 省 实现 函数 noVowel()， 带 一 个 字符 串 "s 作为 输入 参数 ， 如 果 字 符 串 s 
中 不 包含 元 音字 母 ， 则 返回 True， 否则 返回 False ( 即 判 断 字符 串 s 中 是 否 包 含 元 音字 
母 )。 函 数 使 用 示例 结果 如 下 : 


>>> noVowel('crypt') 


True 

>>> noVowel('cwm') 
True 

>>> noVowel('car') 
False 


二 6 珊 昌国 实现 函数 allEven()， 带 一 个 整数 列表 作为 输入 参数 ， 如 果 列 表 中 的 
所 有 整数 均 为 偶数 ， 则 返回 True， 否则 返回 False。 函 数 使 用 示例 结果 如 下 : 


S35 allEvent lg 0 =2 二 = 从 
True 

>>> allEven( [8, 用， -6 10]) 
False 


并 不 是 所 有 的 函数 都 需要 返回 一 个 值 ， 接 下 来 将 给 出 一 个 例子 。 





3.3.3 printt} 与 Zetarn 的 比 疏 


作为 另 一 个 用 户 自 定义 函数 ,我们 开发 了 一 个 个 性 化 的 heLllo() 函数 ， 该 困 数 带 一 个 
姓名 (一 个 字符 串 ) 作为 输入 参数 ， 然 后 输出 一 句 问 候 语 : 


>>> hello('Sue’') 
Hello, Sue! 


我 们 同样 在 函数 £( ) 所 在 的 模块 中 实现 该 蚂 数 : 
模块 : ch3.py 


def hello(Cname) : 
print('Hsll6, ‘' niame 二 11 9 


调用 也 数 hello() 时 ， 输 出 的 结果 为 字符 串 'Hello， '、 输 入 字符 串 和 '! 的 拼 
接续 末 

注意 ， 函 数 hello( ) 在 屏幕 上 输出 内 容 ， 并 不 返回 任何 值 。 那 么 , 调用 print) 的 
另 数 和 返 何 值 的 函数 之 间 有 什么 不 同 呢 ? 


注意 事项 : 语句 return 与 函数 print() 的 比较 
一 个 常见 的 错误 是 在 函数 定义 中 使 用 Print () 函数 代替 return 语句 。 假 设 我 们 按 
如 下 方式 定义 第 一 个 函数 上 (): 


def f(x): 
print (x**2 + 1) 


如 下 运行 结果 似乎 表明 函数 f() 的 这 种 实现 没有 任何 问题 


SS% TY 
5 


然而 ， 当 在 表达 式 中 使 用 函数 于 () 时 ， 结 果 会 出 错 : 


> 
5 
Traceback (most recent call last): 
File ‘<pyshell#103>', line 1, in <module> 
3 共 于 (23 才 和 1 
TypeError: unsupported operand type(s) for *: 
'int' and 'NoneType ' 
当 在 表达 式 “3 * f(2) + 1” 中 对 和 (2) 求 值 时 ，Python 解释 器 会 对 f(2) 求 值 
( 即 执行 )， 也 就 是 输出 值 5， 这 显示 在 Traceback 错误 行 信 息 之 前 。 
因此 £( ) 输出 计算 值 ， 而 不 是 返回 值 。 Sg Le 所 以 在 表 
达 式 中 求 值 结果 为 空 。 实 际 上 ，Python 包含 一 个 “ 空 ”的 数据 类 型 NoneType (显示 在 
错误 信息 中 )。 引 起 错误 信息 的 原因 是 试图 把 一 个 整数 值 与 “ 空 ” 相 乘 。 
也 就 是 说 ， 只 要 目的 是 输出 而 不 是 返回 一 个 值 ， 在 一 个 函数 中 调用 print() 就 没有 
任何 问题 。 





更 编写 马 数 negatives()， 囊 一 个 列表 作为 输入 参数 ， 要 求 输 出 列表 中 
的 负 负 教 ， 每 个 负数 单独 占 一 行 。 函 数 不 返回 任何 值 。 函 数 使 用 示例 结果 如 下 
>>> negatives([4, 0, -1, -3, 6, -9]) 
| 
-3 
: 汪 


3.3.4 函数 定义 实际 上 是 “赋值 ”语句 


为 了 阐述 函数 定义 实际 上 就 是 普通 的 Python 语句 ， 效 果 等 同 于 赋值 语句 ， 我 们 引入 如 
下 程序 : 


模块 : dynamic.py 
3 input('Enter Square Or cube: ') 
if s == 'sqguare': 
def f(x): 
return Xx*xX 
else: 
Ge f(x): 
return X*X*X 


在 上 例 中 ，fE() 定义 在 一 个 Python 程序 中 ， 就 像 赋值 语句 可 以 i a 现在 程序 中 一 
数 £( ) 的 定义 依赖 于 运行 时 用 户 的 输入 。 如 果 在 命令 提示 符 下 输入 cube， 则 工 () ep 
为 立方 函数 . 


>>> 
Enter square or cube: cube 


>>> f (3) 
27 


但 是 ， 如 果 用 户 输入 sdquare， 则 f£f() 被 定义 为 平方 函数 。 
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注意 事项 : 函数 必须 先 定义 后 使 用 
Python 语言 不 允许 在 函数 定义 之 前 调用 ， 就 像 变 量 被 赋值 前 不 能 在 表达 式 中 使 用 一 样 。 
基于 上 述 知识 ， 请 分 析 下 列 模块 中 产生 错误 结果 的 原因 : 
print (f{8)) 


def f(x): 
return x**2 + 1 


答案 : 执行 一 个 模块 时 ， 自 上 而 下 依次 执行 其 中 的 Python 语 句 。 语 名 Print 
(f£(3)) 将 叶 致 错误 ， 因 为 此 时 ff 尚未 被 定义 。 
那么 ， 下 列 模块 是 否 会 产生 函数 运行 错误 呢 ? 


def g(x): 
retirn f(x) 


eo 


def f(x): 
return x**2 + 1 
答案 : 不 会 。 因 为 模块 运行 时 ， 函 数 于 () 和 g() 并 不 会 执行 ， 仅 仅 是 函数 定义 。 定 
义 这 两 个 函数 后 ， 它 们 都 可 以 被 执行 而 不 会 导致 错误 。 


3.3.5 注释 


Python 程序 应 该 包含 完备 的 注释 ， 理 由 如 下 : 

1. 程序 的 用 户 需要 了 解 程序 的 功能 。 

2. 开发 维护 代码 的 开发 人 员 需 要 理解 程序 的 工作 原理 。 

文档 无 论 对 于 程序 开发 人 员 还 是 未 来 的 维护 人 员 都 十 分 重要 ， 因 为 没有 文档 的 代码 维护 
会 很 困难 ， 即 使 对 于 编写 该 代码 的 程序 员 也 是 如 此 。 文 档 一 般 由 了 艺 数 开发 人 员 在 程序 的 附近 
通过 编写 注释 的 方式 来 实现 。 

注释 是 一 行 代 码 中 跟 在 # 后 面 的 内 容 。 为 函数 £( ) 的 实现 增加 注释 说 明 的 示例 如 下 
所 示 : 


def f(x 
res = XxX**2 + 1 # 计算 xxx2+1， 并 把 结果 值 存储 到 res 
return res # 返回 值 res 


Python 解释 天 忽略 注释 〈 即 代码 行 中 # 后 面 的 所 有 内 容 )。 

里 然 注释 是 必需 的 ,但 注意 不 要 过 度 注释 。 注 释 的 原则 是 不 能 破坏 程序 的 可 读 性 。 理 想 
情况 下 ， 程 序 应 该 尽量 使 用 有 意义 的 变量 名 称 、 人 简单 的 良好 设计 的 代码 ， 以 使 得 程序 几乎 可 
以 日 我 解释 。 注 释 应 该 用 于 标识 程序 的 主要 组 件 ， 解 释 说 明 程 序 的 复 洒 部 分 。 


3.3.6 文档 字符 串 


为 了 方便 果 数 用 户 的 人 使用， 函数 也 应 当 编 写 文 档 。 目 前 为 止 ， 我 们 涉及 的 所 有 内 置 郴 数 
均 包 含 文 档 ， 可 以 通过 卫 数 help( ) 来 查看 。 例 如 : 


>>> help(len) 
Help on built-in function len in module builtins: 


Tont saa 
len(object) -> integer 


Return the number of items of a sequence or mapping. 
假如 使 用 help( ) 获取 我 们 的 第 一 个 因数 f() 的 帮助 信息 ， 令 人 惊奇 的 是 ， 同 样 可 以 
获取 如 下 的 一 些 文档 信息 。 
>>> help(f) 
Help on function f in module __main__: 


全 


但 是 ， 为 了 获取 更 有 意义 的 信息 ， 图 数 开 发 人 员 需 要 在 曙 数 定义 中 添加 一 种 特殊 的 注 
释 ， 这 种 注释 可 以 被 help() 工具 谈 取 。 这 种 注释 被 称 为 文档 字符 串 〈docstring)， 用 于 摘 
述 函 数 功能 ， 必 须 直 接 位 于 函数 定义 的 第 一 行 之 下 。 为 困 数 f() 添加 文档 字符 串 “ 返 回 
x**2 + 1” 的 示例 如 下 : 


def (xR): 
' 衣 回 xXx**2+1' 
res = xX**2 + 1 # 计算 x**2+1， 并 把 结果 值 存储 到 res 
return res # 返回 值 res 


为 函数 hello( ) 添加 文档 字符 串 : 


def hello(Cname) : 
' 一 个 个 性 化 的 hello 函数 ， 
print("'Hellos' * Tame 4 * 1:) 


如 果 存 在 文档 字符 串 ， 则 help 函数 将 使 用 它们 作为 函数 文档 。 例 如 ， 当 查看 函数 £( ) 
的 文档 时 ， 将 显示 文档 字符 串 “ 返 回 x**2 + 1”; 


>>> help(f) 


Help on function f in module __main__: 


f (x) 
返回 X##2 + 1 


同样 ， 查 看 hello( ) 的 文档 时 将 显示 其 文档 字符 串 : 


>>> help (hello) 
Help on function hello in module __malin__: 


hello (name) 
一 个 个 性 化 的 hello 函数 


为 练习 题 3.9 的 函数 average() 和 练习 题 3.12 的 函数 negatives() 
分 别 添 加 文档 字符 串 。 使 用 help() 文档 工具 检查 这 两 个 程序 的 文档 字符 串 内 容 。 程 序 运 
行 示例 如 下 : 


>>> help(average) 
Help on function average ‘in module __main__: 


average(x, y) 


返回 x 和 yy 的 平均 值 


命令 式 编导 63 


3.4 Python 变量 和 赋值 语句 


员 数 可 以 在 交互 式 命令 行 中 调用 ,或 者 被 男 一 个 程序 (我们 称 之 为 调用 程序 ) 调用 。 为 
了 设计 函数 ,我 们 需要 理解 调用 程序 (或 者 交互 式 命令 行 ) 如 何 创建 一 个 值 并 作为 输入 参数 
传递 给 困 数 。 在 理解 参数 传递 之 前 ， 首 先 需 要 理解 赋值 语句 的 原理 。 


我 们 基于 赋值 语句 “a = 3” 来 考虑 上 述 问题 。 首 先 请 注意 ， 执 行 该 赋值 语句 之 前 ， 标 
识 符 a 并 不 存在 : 
> a 


Traceback (most recent call last): 
File "<pyshell#15>", line 1, in <module> 
a 
NameError: name 'a' is not defined 


当 执行 如 下 赋值 语句 后 : 
>>> a= 3 


一 个 整 型 对 象 3 和 其 名 称 a 被 创建 。 Python 将 在 由 Python 维护 的 变量 表 中 保存 变量 名 称 。 
描述 示意 如 图 3-7 所 示 。 


a bb & 





和 ae We 
| : { be 
3 | 3.01 | hello | | 
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ss 
| | [2,3,5,8,11] | 
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图 3-7 ”赋值 给 新 变量 。 一 个 int 对 象 ( 值 为 3 ) 被 赋值 给 变量 a ; float 对 象 3.0 被 赋值 给 
变量 b ; str 对 象 'hello' 被 赋值 给 变量 c ; List 对象 [2，3，5，8，111] 被 赋 
值 给 变量 d 

此 时 ， 变 量 a 指 问 值 为 3 的 整 型 对 象 : 


>>> a 
3 


图 3-7 显示 了 变量 表 中 的 其 他 变量 : 变量 b 指向 float 对 象 3.0 ; 变量 c 指向 str 对 
象 'hello' ; 变量 d 指向 list 对 象 [2，3，5，8，11]。 换言之 ,这 表明 还 存在 如 下 
赋值 语句 : 


35> BS 30 
>> CS "helle' 
-> 


一 般 而 言 ，Python 语言 的 赋值 语句 具有 如 下 语法 格式 : 

< 变量 > = < 表达 式 > 
赋值 运算 符 = 右 侧 的 < 表达 式 > 被 求 值 ， 其 结果 值 存储 在 一 个 相应 类 型 的 对 象 中 。 然 后 该 
对 象 被 赋值 给 < 变量 >， 我们 称 之 为 变量 指向 对 象 ， 或 变量 绑 定 到 对 象 。 
3.4.1 可 变 类 型 和 不 可 变 类 型 

针对 变量 a 的 赋值 ， 例 如 : 


>>> aa = 6 


将 重用 既 存 的 变量 a。 该 赋值 语句 的 结果 是 变量 a 将 指 回 另 一 个 对 象 ( 整 型 对 象 6)。 而 
int 对 象 3 将 不 再 被 任何 变量 引用 。 示 意 如 图 3-8 所 示 。 


于 “ 巡 吉 过 


hello' | bl [3.68 41 | 

Pe ] we 

图 3-8 ”把 一 个 不 可 变 对 象 赋值 给 一 个 既 存 变量 。int 对 象 6 被 赋值 给 既 存 变量 a ; int 对 象 
3 不 再 被 赋值 给 任何 变量 ， 因 为 不 再 能 够 被 访问 


需要 量 调 的 是 ， 赋 值 语 句 a = 6 并 没有 改变 整 型 对 象 3 的 值 ， 而 是 创建 了 一 个 新 的 整 
型 对 象 6， 变 量 a 指向 这 个 新 对 象 。 事 实 上 ， 也 无 法 改变 包含 值 3 的 对 象 的 值 。 这 是 Python 
语言 的 一 个 重要 特征 : Python 语言 的 int 对 象 不 能 改变 。 整 型 对 象 并 不 是 唯一 不 能 被 改变 
的 对 象 。 不 能 被 改变 的 对 象 的 类 型 称 为 不 可 变 类 型 。 所 有 的 Python 值 类 型 ( bool、int、 
float 和 complex) 均 为 不 可 变 类 型 。 

在 第 2 章 中 ， 我 们 发 现 列 表 对 象 是 可 以 被 更 改 的 。 例 如 : 


| 
>»»> 过 [3] = 7 

| 

7 


列表 a 在 第 二 条 语句 中 被 更 改 : 索引 为 3 的 项 被 修改 为 7， 如 图 3-9 所 示 。 其 对 象 可 以 被 更 
改 的 类 型 称 为 可 变 类 型 。 


d 可 
修改 前 : | 修改 后 : 








人 
| [Essaa] | 区 [2,3.5.7,11] | 
-| 








gam 


图 3-9 ”列表 是 可 变 类 型 。 赋 值 语句 d[3] = 7 把 列表 a 的 索引 为 3 的 对 象 更 改 为 一 个 新 的 


int 对 象 7 
列表 类 型 是 可 变 类 型 。 数 值 类 型 是 不 可 变 类 型 。 那 么 字符 串 类 型 呢 ? 
> 
So EL 
Traceback (most recent call last): 
File "<pyshell#23>", line 1, in <module> 
ff 生 〗 菇 


TypeError: 'str' object does not support item assignment 


我 们 不 能 修改 字符 串 对 象 中 的 字符 ， 因 此 ,字符 串 类 型 是 不 可 变 类 型 。 
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3.4.2 ”赋值 语句 和 可 变性 

第 第 存在 多 个 变量 指向 同一 个 对 象 的 情况 (特别 是 ， 一 个 值 作为 输入 参数 传递 给 一 个 也 
数 的 情况 )。 有 必要 理解 当 一 个 变量 被 赋予 男 一 个 对 象 时 会 发 生 什 么 。 例 如 ,假设 执行 如 下 
语句 : 


3 A = 3 
>>» BB: 三 


第 一 条 语句 创建 了 一 个 值 为 3 的 整 型 对 象 ， 并 赋值 给 变量 a。 第 二 条 赋值 语句 中 ， 表 达 
式 a 的 求 值 结 果 为 整 型 对 象 3， 并 被 赋值 给 另 一 个 变量 bp。 示意 图 如 图 3-10 所 示 。 


图 3-10” 指 问 同 一 个 对 象 的 多 个 引用 。 赋 值 语句 bp = a 中 ， 运 算 符 = 右 侧 的 表达 式 a 求 值 结 
果 为 对 象 3， 并 被 赋值 给 变量 b 

变量 a 和 b 同时 指向 同一 个 整 型 对 象 3。 此 时 ， 如 果 我 们 给 变量 a 赋予 其 他 值 ， 结 果 会 
如 何 ? 

区 

赋值 语句 a = 6 并 没有 把 对 象 的 值 从 3 更 改 为 6， 因 为 int 类 型 为 不 可 变 类 型 。 因 此 ， 
变量 a 将 指向 一 个 新 的 值 为 6 的 对 象 。 那 么 变量 b 呢 ? 

>>> a 


6 
>>> b 


CD 


变量 b 依旧 指向 值 为 3 的 对 象 ， 示 意 如 图 3-11 所 示 。 


a hb 
ee 
ee Se 
i 
| | 
各 | | 


i 
加 二 四 
| 


| 

| 

Ne i 
图 3-11 多 重 赋值 和 可 变性 。 如 果 变 量 a 和 b 指 回 同一 个 对 象 3， 随 后 对 象 6 被 赋值 给 变量 
a， 则 变量 b 依旧 指 问 对 象 3 


关键 点 在 于 : 如 果 两 个 变量 指向 同一 个 不 可 变 对 象 ， 则 修改 一 个 变量 不 会 影响 另 一 个 


岂 


好。 
接 下 来 我 们 讨论 列表 的 情况 。 一 开始 把 一 个 列表 赋值 给 变量 a， 然 后 把 变量 a 赋值 给 变 
量 b。 
3>3 a [3 4，5] 
> DD 





图 3-12 ”可 变 对 象 的 多 重 赋 值 。 两 个 变量 a 和 b 指向 同一 个 列表 。 赋 值 语句 b[1] = 8 和 赋 
值 语 句 a[-1] = 16 将 更 改 同 一 个 列表 ， 因 此 任何 对 变量 b 指向 的 列表 的 更 改 ， 也 
将 更 改变 量 a 所 指向 的 列表 ， 反 之 亦 然 


现在 我 们 讨论 将 一 个 新 对 象 赋值 给 b[1l1]: 


2 Ll 二老 
> BD 

[3 人 
SS 诞 

[已 ， 电 ] 


正如 第 2 章 所 述 ， 列 表 可 以 被 修改 。 列 表 b 通过 赋值 语句 b[1] = 8 被 修改 。 但 是 ， 


因为 变量 a 也 绑 定 到 同一 个 列表 ， 所 以 变量 a 同时 被 修改 。 同 样 ， 修 改 列表 a 也 会 更 改 列 
表 b: 赋值 语句 a[-1] = 16 将 列表 a 和 ob 的 最 后 一 个 对 象 改 变 为 一 个 新 的 对 象 16. 


玫 训 3 和 区 几 绘制 表示 执行 如 下 语句 后 的 变量 和 对 象 状态 的 示意 图 : 
>35 & = [5 BT 


>>> b= 3 
>>> a = 3 
3.4.3 ”交换 
现在 我 们 讨论 一 个 基本 的 赋值 问题 。 设 变量 a 和 b 指 癌 两 个 不 同 的 整 型 值 : 
>2> 所 三 6 
>>> b = 3 


假设 我 们 需要 交换 变量 a 和 b 的 值 。 换 言 之 ， 交 换 之 后 ， 变 量 a 指 丫 3， 变量 b 指 问 


。 不 意图 如 图 3-13 所 示 。 


a hb 





图 3-13 交换 值 。 变 量 a 和 b 交换 它们 所 指向 的 对 象 。Python 文 持 多 重 赋值 ( 即 序 列 解 包 赋 
值 )， 以 方便 交换 


如 果 我 们 把 变量 b 的 值 赋 给 变量 a: 


则 变 


3 
人 
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a=b 


量 a 将 与 变量 b 指 癌 同 一 个 对 和 象 ， 变量 a 和 变量 b 同时 指向 3， 同 时 会 “失去 ” 整 


tl ta 


b : 


列 解 


式 下 


ws 


语句， 


则 多 


DD 


了 


>>> temp = a # temp 指向 6 

35 A # a 指向 3 

>>> b = temp #b 指向 6 

在 Python 语言 中 ， 还 有 一 个 更 简单 的 方法 可 以 实现 交换 。Python 文 持 多 重 赋 值 ( 即 序 
包 赋 值 ) 语句 : 


在 多 重 赋值 ( 即 序列 解 包 赋值 ) 语句 “a，b = b，a” 中 , 运算 符 = 右 侧 的 两 个 表达 
smd 然后 分 别 赋 信 给 左 侧 对 应 的 变量 。 

结束 讨论 Python 赋值 语句 之 前 ， 请 注意 为 一 个 Python 特性 。 一 个 值 可 以 同时 赋 给 多 
时 : 


>>>i=j=k=0 


三 个 变量 i 、j 、k 均 被 赋值 为 0。 


9 假设 有 一 个 非 空 的 列表 team 已 被 正确 赋值 。 编 写 一 条 或 多 条 Python 
交换 列表 中 的 第 一 个 和 最 后 一 ei 

>>> Veanm = ['Ava', I'Eleanor', 'Clare', Sarah'] 

吉 果 列表 为 : 

>>> team 

["Sarall's "Eleanor's "Clare's AVI 
参数 传递 


透彻 理解 了 Python 赋值 语句 的 原理 之 后 ， 就 可 以 理解 函数 调用 中 输入 参数 的 传递 方式 
图 数 既 可 以 通过 交互 式 命 令 行 调用 ， 也 可 以 通过 其 他 程序 调用 。 两 者 均 称 为 调用 程序 。 


明 数 调用 中 的 输入 参数 是 调用 程序 中 所 创建 的 对 象 的 名 称 。 这 些 名 称 可 能 指向 可 变 类 型 或 不 
可 变 类 型 。 接 下 来 分 别 讨论 这 两 种 情况 。 


.3， 


1 不 可 变 类 型 参数 传递 
我 们 采用 如 下 函数 g() 来 讨论 在 函数 调用 中 传递 指向 一 个 不 可 变 对 象 的 引用 的 


效果 。 


模块 : ch3.py 


def g(x): 
X= 5 


首先 我 们 把 整数 3 赋 给 变量 名 a: 


>>> a = 3 


在 上 述 赋 值 语句 中 ， 整 型 对 象 3 被 创建 并 赋 给 变量 名 a， 如 图 3-14 所 示 。 


图 3-14” 主 程序 中 的 赋值 语句 。 在 主 程序 (交互 式 命令 行 ) 中 ， 整 型 对 象 3 被 赋 给 变量 名 a 
图 3-14 表明 ， 变 量 名 a 已 经 在 交互 式 命令 上 下 文中 定义 。 变 量 名 a 指 回 一 个 值 为 3 的 
整 型 对 象 。 接 下 来 ,我 们 使 用 变量 名 a 作为 输入 参数 调用 卫 数 g( ): 


>>> g(a) 
当 执行 该 师 数 调用 时 ， 首 先 参数 a 被 求 值 。 其 求 值 结果 为 整 型 对 象 3。 请 回顾 因数 g( ) 
的 定义 : 
def g(x): 
区 = 5 
然后 ,“ def g(x):” 中 的 变量 x 被 赋值 为 指 问 输 入 整 型 对 象 3。 其 效果 等 同 于 执行 了 赋值 


六 


语句 X = a。 
因此 ， 开 始 执行 g(a) 时 ， 两 个 变量 指向 同一 个 对 象 3: 变量 a 在 交互 式 命令 行 中 
而 变量 x 在 函数 g( ) 中 定义 (请 参见 示意 图 3-15 ) 。 


遇 数 g() 





图 3-15 参数 传递 。 隐 数 调用 g(a) 把 引用 a 作为 输入 参数 传递 。 开 始 执行 g( ) 时 定义 的 变 
量 x 将 被 赋值 为 该 引用 。a 和 x 将 同时 指 癌 同一 个 对 象 
在 g(a) 的 执行 过 程 中 ， 变 量 x 被 赋值 为 5。 由 于 整 型 对 象 是 不 可 变 类 型 ， 因 此 x 
不 再 指向 3， 而 是 指向 一 个 新 的 整 型 对 象 5， 如 图 3-16 所 示 。 但 是 ， 变 量 a 依然 指 癌 
对 象 3。 
这 就 是 上 述 例子 的 关键 点 所 在 。 因 数 g( ) 不 会 也 不 能 改变 交互 式 命 令 行 中 的 变量 a 的 


值 。 一 般 而 言 ， 调 用 和 执行 一 个 果 数 时 ， 圾 数 不 会 修改 任何 作为 盟 数 参数 传递 的 指 癌 不 可 变 
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对 象 的 变量 。 





图 3-16 不 可 变 类 型 参数 传递 。 当 执行 语句 x = 5 时 ，x 将 指向 一 个 新 的 值 为 5 的 整 型 对 象 。 
值 为 3 的 整 型 对 象 保持 不 变 。 主 程序 (交互 式 命 令 行 ) 中 的 变量 a 依然 指向 该 对 象 


那么 ， 如 果 传 递 一 个 可 变 对 象 引 用 ， 结 果 会 怎样 ? 
3.5.2 ”可 变 类 型 参数 传递 
我 们 采用 如 下 也 数 来 讨论 在 函数 调用 中 传递 一 个 可 变 对 象 的 变量 的 效果 。 


模块 : ch3.py 


def h(lst): 
lst[0] = 5 


考虑 执行 如 下 语句 后 的 结果 : 


>>> mybiat = [3, 6€, 9, 12] 
>>> hl(myList) 


在 上 述 赋值 语句 中 ， 创 建 了 一 个 列表 对 象 ， 并 赋值 给 变量 myList。 然 后 调用 盟 数 
h(myList)。 当 函数 h() 开始 执行 时 ，myList 指 回 的 列表 将 被 赋值 给 h() 的 辆 数 定 义 中 
的 变量 名 1st。 因 此 上 述 情 况 可 以 用 图 3-17 描述 。 


果 数 h() 





| [3,6,9,12] | 


图 3-17 可 变 类 型 参数 传递 。 函 数 调用 h() 把 指向 一 个 列表 的 引用 作为 参数 传递 。 因 此 交互 
式 命令 中 的 变量 myList 和 hl() 中 的 变量 1st 现在 指向 同一 个 列表 


当 执 行 函 数 h() 时， lst[0] 将 被 赋值 为 53， 因此 1lst[0] 将 指向 一 个 新 的 对 象 
5。 由 于 列表 是 可 变 类 型 ， 所 以 1st 指向 的 列表 对 象 被 修改 。 由 于 交互 式 命令 行 中 的 变量 
myList 指向 同一 个 列表 对 象 ， 这 就 意味 着 myList 指向 的 列表 对 象 也 被 修改 。 示 意图 如 图 
3-18 所 示 。 

这 个 例子 表明 ， 在 男 数 调用 时 ， 如 果 一 个 可 变 对 象 (例如 ， 列 表 对 象 [3,6,9,12]) 作 
为 输入 参数 传递 ， 则 函数 可 以 修改 该 对 象 。 


3 
w 
证 
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myList lst 


明 数 £() 





[5,6,9,12] 
图 3-18 ”函数 可 以 修改 可 变 类 型 参数 。 由 于 列表 是 可 变 类 型 ， 因 此 赋值 语句 lst[0] = 5 把 


索引 为 0 的 列表 项 替代 为 S。 由 于 主 程序 (交互 式 命令 行 ) 中 的 变量 myList 指 问 同 
一 个 列表 ， 因 此 修改 的 结果 在 主 程序 中 也 可 见 


3 里 其 [1 滥 实 现 一 个 函数 swapFL()， 带 一 个 列表 作为 输入 参数 ， 要求 交 换 列 表 中 
的 第 一 个 和 最 后 一 个 元 素 。 可 以 假定 列表 非 空 。 子 数 不 返 回 任何 值 。 程 序 运行 示例 如 下 : 

>>> ingredients = ['flour', 'sugar', 'butter', 'apples'] 

>>> swapFL(ingredients) 


>>> ingredients 
[Lapploes", sugar', ‘butter:; 公事 和 


3.6 ”电子 教程 案例 研究 : 目 动 化 海 包 图 形 


在 程序 的 不 同 部 分 重复 使 用 相同 的 代码 片段 是 很 常见 的 现象 。 在 案例 研究 CS.3 中 ， 我 
们 展示 了 把 代码 片段 封装 为 函数 并 把 程序 中 的 代码 片段 替换 为 限 数 的 优点 。 这 个 案例 研究 有 
效 地 说 明了 (功能 ) 封 妆 和 抽象 的 基本 软件 工程 概念 。 


3.7 ”本 章 小 结 


第 3 章 介 绍 了 编写 Python 程序 的 工具 以 及 基本 的 程序 开发 概念 。 首 先 ， 我们 介绍 如 何 
使 用 内 置 也 数 print()、input() 和 eval() 编写 非 浓 简单 的 交互 式 程序 。 然 后 ， 为 了 
编写 能 够 根据 用 户 的 输入 执行 不 同 语句 的 程序 ， 我 们 引入 if 语句 。 我 们 描述 了 单 分 文 和 双 
分 文 语 法 形式 。 

接 下 来 我 们 介绍 了 for 循环 语句 的 简单 形式 : 作为 迭代 列表 的 项 或 者 字符 串 的 字符 的 
方式 。 我 们 还 引入 了 range() 限 数 ， 实 现在 给 定 范 围 的 整数 序列 上 进行 迭代 。 

本 草 的 重点 是 如 何在 Python 中 定义 新 图 数 。 首 先 介 绍 了 因数 定义 语句 的 语法 ， 然 后 重 
点 讨论 了 参数 传递 〈《 即 调用 因数 时 如 何 传递 参数 )。 为 了 理解 参数 传递 ， 我 们 次 入 讨论 了 赋 
值 语 句 的 工作 原理 。 最 后 ， 我 们 介绍 了 通过 注释 和 文档 字符 串 为 一 个 果 数 编写 文档 的 方法 。 


3.8 练习 题 答案 


3.1 使 用 一 个 input ( ) 语句 来 获取 温度 。 用 户 输入 的 值 作为 字符 串 处 理 。 把 字符 串 值 转变 为 数值 的 
方法 之 一 是 使 用 eval( ) 函数 。eval( ) 函数 把 字符 串 作为 表达 式 求 值 。 使 用 一 个 算术 表达 式 实 
现 从 华氏 温度 到 摄氏 温度 的 转换 ， 然 后 输出 结果 。 
fahr = eval (input('Enter the temperature in degrees Fahrenheit: ')) 


els = (fahr - 32) 未 5 /9 
print('The temperature in degrees Celsius is', cels) 
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3.2 ”下面 为 交互 式 命令 行 中 实现 的 if 语句 (省 略 了 运行 结果 ): 


>2> 1f£ age > 6062: 
print('You can get your pension benefits!') 
>>> if name in Musial’", 'Aaron','Williams', "Gohrig'. Ruth']: 
print('One of the ph 5 baseball Pe ever!') 
>>> if hits > 10 and shiel 
print('You\'re dead Wi 
>>> If north or South or east or west: 
print('I can escape.') 


3.3 下面 为 交互 式 命令 行 中 实现 的 if 语句 (省 略 了 运行 结果 ): 


>>> if year % 4 == 
print('Could be a leap year.') 
else: 
print('Definitely not a leap year.') 
>>> if ticket == lottery: 
dy won!') 
else: 
printt’ Better luck next time...') 


3.4 首先 定义 列表 users。 然 后 使 用 函数 input( ) 请 求 用 户 输入 id。 在 if 语句 中 使 用 条 件 “ id 
in users” 来 确定 输出 相应 的 信息 : 


Users = L'jae*, BUG , "Bans” , 'sophie'] 
id = input('Login : 1 ) 
if id in USerS : 

print('You are in!') 
else: 

print('User unknown.') 
print('Done.') 


图 3-19 描述 了 该 程序 不 同 执 行 流 的 流程 图 。 


users = ['joe','sue','hani','sophie'] 





id = input('Login: ') 


图 3-19 程序 流程 图 。 实 线 箭头 表示 无 条 件 执行 的 流 。 虚 线 箭头 表示 根据 条 件 可 能 执行 的 流 


3.5 使 用 一 个 for 循环 语句 迭代 列表 中 的 单词 。 对 于 每 一 个 单词 ， 检 查 其 长 度 是 否 为 4， 如果 长 度 为 
4， 则 输出 。 


wordList = eval(input('Enter word list: ')) 
£6r Word in wordList: 
if len(word) == 
print (word) 


72 务 了 入 


3.6 使 用 如 下 的 for 循环 语句 实现 程序 的 功能 : 


> fo0r 1 in ranget10):; 
print(1i) 

>>> for i in range(2) : 
print (i) 


3.7 省 略 完整 的 for 循环 语句 ， 仅 给 出 range 因数 : 
(a) range (3,13), (bb) range (0,10,2h te) range( 0 24 .3 (dzangetr 3 12 5) 
3.8 半径 为 了 的 圆 的 周 长 是 2rr。 注 意 首 先 必 须 导 入 math 模块 ， 才 能 人 够 使 用 math .pi: 


import math 
def perimeter(radius): 
return 2 * math.pi * radius 


3.9 ”好 数 average() 带 两 个 输入 参数 。 我 们 使 用 变量 名 x 和 Yy 指 同 输入 参数 。x 和 y 的 平均 值 为 
(x+y )/2: 


和 


def average(x, y): 
returm (x + y} / 2 


3.10 使 用 一 个 for 循环 语句 来 检查 输入 字符 串 中 各 字符 是 否 为 元 音 。 如 果 包 含 元 音字 母 ， 则 立即 返 
回 False。 只 有 当 所 有 的 字母 都 检查 完毕 后 ( 即 for 循环 语句 执行 完毕 后 de True, 
def noVowel(s): 

' 如 果 字 符 串 s 不 包含 任何 元 音 ， 返 回 True， 否 则 返回 False， 
过 0 9 和 和- 小 
i € in 'asiouAEIOU': 
return False 
return True 


3.11 使 用 一 个 for 循环 语句 来 检查 列表 中 的 各 数值 是 否 为 偶数 。 如 果 不 为 偶数 ， 则 立即 返回 

False。 仅 当 for 循环 语句 执行 完毕 后 ， 才 返回 True。 
def allEven(numList): 

' 如 果 numlist 中 的 所 有 整数 均 为 偶数 ， 则 返回 True， 和 否则 返回 False' 

for num in numList: 

if numAp2 1= 0: 
return False 
return True 


3.12 ”图 数 需要 迭代 列表 中 的 所 有 数值 ， 测 试 各 数值 以 确定 其 是 否 为 负数 。 如 果 为 负数 ， 则 输出 该 
数值 。 
def negatives(lst): 
' 输出 列表 1st 中 的 负数 ， 
or 1 4 Laat: 
TE 
print (i) 
3.13 ”文档 字符 串 的 实现 参见 各 目的 练习 题 答 案 . 
3.14 当 变 量 a 被 赋值 为 3 时 ，a 被 绑 定 到 新 对 象 3。 变 量 b 则 依旧 绑 定 到 列表 对 象 。 


a BB 
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3.15 ”多重 赋值 (4 即 序列 解 包 赋值 ) 语句 是 实现 交换 的 最 简单 方式 : 
>>> team[0] team[-1] = team[-1] , team[0] 
为 一 种 交换 方式 是 使 用 一 个 临时 变量 temp: 
>>> temp = team[0] 


>>> team[0] = team[-1] 
>>> team[-1] = temp 


3.16 ”该 图 数 仅 仅 对 上 一 个 练习 题 中 所 开发 的 交换 代码 进行 封装 。 
def swapFL(lst): 


latL0], Lst[=1] = let[-1], Ist[0] 
3.9 ”习题 


3.17 使 用 eval() 困 数 把 下 列 字 符 串 作为 Python 表达 式 求 值 : 
(a) '2*3+1i' 7 


(b) 'hello' 

(© "IheDlor Fr worldl*™ 
(0 "HOLL eontt! LY 
(= 


哪 一 个 求 值 结 果 会 出 现 错误 ?请 给 出 解释 。 
3.18 假设 在 交互 式 命 令 行 中 按 如 下 方式 定义 了 变量 a、b 和 c: 
>>> Bs Ds 三 ds 3 
在 交互 式 命令 行 中 ,编写 if 语句 ， 如 果 满 足下 列 条 件 ， 则 输出 ' OK': 
a) a 小 于 b。 
Ss 
) a 和 b 之 和 等 于 c。 
fe 的 平 才 。 
3.19 ”改写 习题 3.18， 增 加 一 项 功能 ， 当 条 件 不 满足 时 ， 输 出 'NOT OK'. 
3.20 ”编写 一 个 for 循环 语句 ， 和 迭代 一 个 字符 串 列 表 1st， 输 出 每 个 单词 的 前 三 个 字母 。 假 如 1st 为 
列表 ['January'，'February'，'March' ] ， 则 输出 如 下 内 容 : 
Jan 
Feb 
Mar 
3.21 编写 一 个 for 循环 语句 ， 迭 代 一 个 数值 列表 1lst， 输 出 列表 中 的 偶数 。 例 如 ,假设 1st 为 
[27 37 yr 5 了 和 六 
3.22 ”编写 一 个 for 循环 语句 ， 迭 代 一 个 数值 列表 1st， 输 出 列表 中 数值 的 平方 能 被 8 整除 的 数值 。 
例如 ， 假 设 1st 为 [2，3，4，5，6，7，8，9]， 则 输出 数值 4 和 8。 
3.23 ”编写 使 用 果 数 range( ) 的 for 循环 语句 ， 输 出 如 下 序列 : 
(a) 01 
(b) 0 
(Ch 34556 
(ak 1 
(6) 03 
LE 1 


/74 


,10 


3 


3.26 


3.27 


3.28 


3.30 


事 了 各 


思考 题 


注意 : 在 程序 中 ， 如 果 要 求 使 用 交互 式 输入 非 字 符 串 的 值 ， 则 需要 使 用 男 数 eval( ) 强制 
Python 把 用 户 输入 的 内 容 作 为 Python 表达 式 (而 不 仅仅 是 一 个 字符 串 ) 处 理 。 
实现 一 个 程序 ， 请 求 用 户 输入 一 个 单词 列表 ， 然 后 输出 列表 中 不 是 ' secret' 的 每 个 单词 。 
>>> 
Enter list of words: ['cia','secret',  'mi6', 'igsi','secret'] 
cia 
mi6 
isi 
实现 一 个 程序 ， 请求 用 户 输入 一 个 学 生 姓 名 列表 ， 然 后 输出 以 A 到 M 开头 的 姓名 。 


>>> 

Biter ligst: [ELiiei Steve', ‘Sam's "Owen', Gavin'] 
Ellie 

Gavin 


实现 一 个 程序 ， 请 求 用 户 输入 一 个 非 空 列表 ， 然 后 在 屏幕 上 输出 列表 的 第 一 个 和 最 后 一 个 元 素 
的 信息 。 

S35 

Enter a ligsbs (3, 5, ,9 

The first list element is 3 

The last list element is 9 


实现 一 个 程序 ， 请 求 用 户 输 入 一 个 正 整 数 n， 然 后 输出 前 4 个 n 的 整数 倍数 。 


SS 

Enter n: 5 
0 

5 

10 

15 


实现 一 个 程序 ， 请 求 用 户 输入 一 个 整数 n， 然 后 在 屏幕 上 输出 0 到 nn (不 包括 nn) 的 平方 。 


SS 

Enter n: 3 
0 

| 

4 


实现 一 个 程序 ， 请 求 用 户 输入 一 个 正 整数 n， 然 后 在 屏幕 上 输出 n 的 所 有 正 因子 。 注 意 : 0 不 是 
任何 整数 的 因子 ， 而 n 整除 自 号 。 


>>> 

Enter n: 49 
1 

7 

49 


实现 一 个 程序 ， 请 求 用 户 输入 四 个 数值 (整数 或 浮 点 数 )。 先 计算 前 三 个 数 的 平均 值 ， 然 后 把 平 
均值 与 第 四 个 数 进行 比较 。 如 果 相 等 ， 则 程序 在 屏幕 上 输出 “Equal”。 

> > 

Enter first number: 4.5 

Enter second number: 3 

Enter third number: 3 

Enter last number: 3.5 

Equal 


3.33 


3.34 


3.36 


3.37 
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实现 一 个 程序 ， 请 求 用 户 输入 投掷 飞镖 的 坐标 xx 和) ( 均 位 于 .-10 到 10 之 间 )， 并 计算 飞镖 是 否 
命中 中 心 位 于 (0，0)、 半 径 为 8 的 圆 形 飞镖 靶 。 如 果 命中 ， 则 在 屏幕 上 输出 “It is in!”。 
>>> 

Enter xX: 2.5 

Enter y: 4 

I 18 Td 

实现 一 个 程序 ， 请 求 用 户 输入 一 个 四 位 数 的 整数 ， 然 后 输出 各 位 上 的 数字 。 不 允许 使 用 字符 串 
数据 类 型 操作 完成 任务 。 要 求 程序 读 取 用 户 的 输入 作为 整数 ， 然 后 使 用 标准 的 算术 运算 符 (+、 
* 、-、/、8， 等 等 ) 处 理 该 整数 。 

>>> 

Enter n: 1 234 


1 
3 
= 


实现 一 个 阴 数 reverse string(),， 带 一 个 三 个 字符 的 字符 串 作 为 输入 参数 ， 输 出 字符 反 序 
的 字符 串 。 

>>> reverse_string('abc') 

Cha 

>>> reverse_string('dna') 

‘and'! 

实现 一 个 水 数 pay ( ) ， 带 两 个 输入 参数 : 一 个 雇员 上 星期 的 小 时 工资 和 工作 小 时 数 。 程 序 计算 
并 返回 座 员 的 工资 。40 小 时 以 外 的 工作 算 加 班 ， 加班 工资 为 平时 工资 的 1.5 倍 。 

>>> pay(10，35) 

350 

>>> pay (10, 45) 

475.0 

括 一 枚 公平 硬币 n 次 后 得 到 个 正面 的 概率 是 2"。 实 现 一 个 晴 数 prob ( )， 带 一 个 非 负 整 数 
作为 输入 参数 ， 返 回 毛 一 枚 公平 硬币 n 次 后 得 到 个 正面 的 概率 。 

>>> Prob(1) 

0:5 


>>> prob(2) 
0.25 


实现 一 个 胃 数 reverse_int() ， 带 一 个 三 位 数 整数 作为 输入 参数 ， 输 出 数字 反 序 的 整数 。 例 
如 ， 如 末 输 入 为 123， 则 函数 返回 321。 不 允许 使 用 字符 串 数 据 类 型 操作 完成 任务 。 程 序 应 该 仅 
谈 取 输入 作为 整数 ， 并 使 用 运算 符 (例如 ，// 和 %) 处 理 该 整数 。 可 以 假定 输入 整数 的 最 后 一 
位 数字 不 为 0。 
>>> reverse_int (123) 
321 
>>> reverse_int (908) 
809 
编写 消 数 points ( ) ， 带 四 个 数值 x,、y,、x,、y 作为 输入 参数 ， 它 们 代表 平面 上 的 两 个 点 (x， 
yi ) 和 (x,，，y,) 的 坐标 。 程 序 将 计算 : 
e 通过 两 个 点 的 直线 的 斜率 ， 垂 直 直 线 除 外 。 
e 两 个 点 的 距离 。 

呆 数 按 如 下 格式 输出 计算 的 斜率 和 距离 。 如 果 直 线 是 垂直 的 ， 则 斜率 的 值 为 字符 
串 ' infinity'。 注意 : 请 把 斜率 和 距离 转换 为 字符 串 后 ， 青 输出 。 


Z]O 


3.39 


3.40 


3.41 


3.42 


3.44 
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> Polnts(t0, Oy 1 1) 
斜率 是 1.0， 距 离 是 1.41421356237 
>>> points(0, 0, 0, 1) 
斜率 是 无 穷 ， 距 离 是 1.0 
实现 了 滑 数 abbreviation()， 币 一 个 英文 星期 作为 输入 参数 ， 输 出 星期 的 前 两 个 字母 缩写 。 
>>> abbreviation('Tuesday') 
ey 
编写 一 个 计算 机 游戏 辆 数 col11ision()， 检 查 两 个 圆 形 对 象 是 否 碰撞 。 如 果 发 生 碰 撞 ， 则 返 
回 True， 否 则 返回 False。 每 个 圆 形 对 象 由 其 半径 和 中 心 位 置 坐标 (x，y) 指定 。 因 此 ， 上 因数 
带 六 个 数值 作为 输入 参数 : 第 一 个 圆 的 中 心 位 置 坐标 和 yy 及 其 半径 方 ， 第 二 个 圆 的 中 心 位 置 
坐标 必 2 和 > 及 其 半径 gk 
> SOllision(B, 0 3 0 5 3) 
True 
> 9 二 2 
False 
实现 师 数 partition()， 把 一 个 足球 运动 员 列 表 分 成 两 个 组 。 更 准确 地 ， 上 四 数 寓 一 个 姓名 列 
表 作 为 输入 参数 ， 输 出 以 A 到 M 开头 的 足球 运动 员 的 姓名 -。 
>>> partition(['Eleanor , 'Evelyrn', 'Sammy', 'Owen', 'Gavin'j) 
Eleanor 
Evelyn 
Gavin 
编写 困 数 lastF( )， 带 两 个 字符 串 作为 输入 参数 ,分别 代 表 'FirstName' 和 'LastName ' ， 
输出 格式 为 'LastName，F.' 的 字符 串 ( 即 仅 输出 英文 名 字 的 首 字母 )。 
>>> lastF('Albert', ‘'Camus’) 
‘Gam A 
实现 函数 avg ( ) ， 带 一 个 包含 若干 数值 列表 的 列表 作为 输入 参数 。 每 个 数值 列表 表示 一 个 学 生 
基 门 课程 的 成 绩 。 例 如 ， 一 门 课 程 4 名 学 生 的 成 绩 输入 列表 参数 如 下 : 
[[95,92,86,87],[66,54],[89,72,100],[33,0,0]] 
师 数 avg 输出 每 个 学 生 的 平均 成 绩 ， 每 个 学 生 单 独占 一 行 。 可 以 假设 成 绩 列 表 均 非 空 ， 但 
是 并 不 保证 每 个 学 生 的 成 绩 个 数 相同 。 
SELL95 927 86 B17); L686. BDA}, [89. 0 3 人 站 
90 .0 
60 .0 
87 .0 
9 
实现 计算 机 游戏 函数 hit() ， 带 五 个 数值 作为 输入 参数 : 圆 C 的 中 心 位 置 坐 标 x 和 yy 及 其 半径 ， 点 
P 的 位 置 坐 标 x 和 y。 如 果 P 位 于 圆 C 内 部 或 者 位 于 圆 C 上 ， 则 明 数 返回 True， 和 否则 返回 False. 
3 HE 和 本 忆 的 
True 
2 
False 
编写 一 个 函数 distance( )， 带 一 个 数值 作为 输入 参数 : 闪电 和 雷 声 之 间 的 时 间 差 (单位 为 秒 )。 
困 数 返回 闪电 击 中 位 置 的 距离 (单位 为 千 米 )。 声 音 传播 的 速度 大 约 为 340.29 米 / 秒 . 
>>> distance(3) 
1.0208700000000002 
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本 曹 重点 讨论 用 于 文本 和 文件 处 理 的 Python 工具 和 问题 求解 模式 。 

首先 我 们 继续 讨论 第 2 章 介绍 的 字符 串 类 。 特 别 讨论 字符 串 方法 的 扩展 集合 ， 它 们 赋予 
了 Python 强大 的 文本 处 理 能 力 。 然 后 我 们 讨论 Python 提供 的 控制 输出 文本 格式 的 文本 处 理 
工具 。 我 们 重点 讨论 用 于 解析 和 创建 包含 日 期 和 时 间 数 据 的 字符 串 的 工具 。 

擎 握 了 文本 处 理 之 后 ,我们 将 继续 讨论 文件 和 文件 输入 /输出 ( WO)( 即 Python 程序 中 
如 何 读 取 文 件 内 容 ， 以 及 如 何 将 数据 写 入 文件 中 )。 当 今 的 许多 计算 都 涉及 处 理 存 储 在 文件 
中 的 文本 内 容 。 我 们 定义 了 几 种 读 取 文 件 的 模式 ， 这 些 文件 给 程序 提供 需要 处 理 的 内 容 。 

处 理 用 户 交 互 式 输 入 的 数据 以 及 取 自 文件 的 数据 时 ， 会 给 程序 引入 实际 很 难 控制 的 错误 
源 。 我 们 将 讨论 可 能 产生 的 常见 错误 ， 介绍 异常 的 概念 以 及 默认 的 异常 控制 流程 。 


4.1 深入 研究 字符 串 

在 第 2 草 中 ， 我 们 介绍 了 字符 串 类 str。 当 时 的 目的 是 说 明 Python 支持 数值 以 外 的 其 
他 值 。 我 们 讨论 了 如 何 使 用 字符 串 运算 符 编 写字 符 串 表达 式 和 处 理 字符 串 ， 其 方式 和 编写 代 
数 表 达 式 类 似 。 我 们 还 使 用 字符 串 引 入 了 索引 运算 符 [ ] 。 

在 本 市 中 ,我 们 将 更 加 深入 地 讨论 字符 串 的 其 他 功能 。 特 别 地 ， 我 们 将 描述 索引 运算 符 
的 一 个 更 加 通用 的 版 本 ， 以 及 许多 常用 的 字符 串 的 方法 ， 这 些 功 能 使 得 Python 成 为 一 个 强 
大 的 文本 处 理工 具 。 


4.1.1 字符 串 表 示 
我 们 已 经 了 解 到 字符 串 值 可 以 表示 为 包含 在 引号 (英文 单 引 号 或 双 引 号 ) 中 的 字符 序列 : 


>>> "Hello, Worjdi" 


注意 事项 : 遗漏 引号 错误 
书写 字符 串 值 的 一 个 常见 错误 是 遗漏 引号 。 如 果 遗 漏 了 引号 ， 则 文本 将 作为 名 称 处 理 
(例如 ， 变 量 名 )， 而 不 是 作为 字符 串 值 。 因 为 通常 没有 给 该 变量 赋值 ， 所 以 会 导致 一 个 错 
误 。 举 例如 下 : 
>>> hello 
Traceback (most recent call last): 
File "<pyshell#35>", line 1, in <module> 
hello 
NameError: name 'hello' is not defined 
上 述 错 误 信 息 表 示 名 称 hello 没有 被 定义 。 换 言 之 ,表达 式 hello 被 当 作 一 个 变 
量 来 对 待 ， 错 误 是 尝试 求 值 该 变量 的 结果 。 


字符 串通 过 使 用 引号 分 隔 符 来 标识 ， 那 么 如 何 构造 包含 引号 的 字符 串 呢 ? 如 果 文 本 包含 
一 个 单 引 号 ， 我 们 可 以 使 用 双 引 号 分 隅 符 ， 反 之 则 使 用 单 引 号 分 隔 符 : 


>>> XCUSe = ‘TT am "Slick’ 
>>>: fact = i'm siek'" 


如 条文 本 中 包含 两 种 类 型 的 引号 ， 则 可 以 使 用 转 义 字符 序列 \' 或 \" 来 指明 引号 不 是 
分 隅 待 ， 而 是 字符 串 值 的 一 部 分 。 因 此 ， 如 果 要 创建 一 个 字符 串 值 : 


Fm 二 人 其 ， 
其 书写 方法 如 下 : 
>> GXCUSe = ‘I\m "sick"' 


让 我 们 验证 一 下 它 是 否 正确 : 

>>> excuse 

‘I\'m "sick"! 
好 吧 ， 结 果 看 起 来 并 不 如 人 人意。 我 们 期 望 的 结果 是 “I'm"sick"”。 结 果 还 是 产生 了 转 义 
字符 序列 \'。 为 了 使 得 Python 更 好 地 输出 字符 串 (把 转 义 字符 序列 \' 输出 为 ')， 可 以 使 
用 print() 水 数 。print() 困 数 带 一 个 表达 式 作 为 输入 参数 ， 并 在 屏幕 上 输出 结果 。 如 
采 是 字符 串 表 达 式 ， 则 print() 困 数 将 会 解释 字符 串 中 的 所 有 转 义 字符 序列 并 忽略 字符 串 
分 隔 符 : 

>>> PITint(excuse) 

I'm "sick" 

总 而 言 之 ， 字 符 串 中 的 转 义 字符 序列 是 以 \ 开始 的 字符 序列 ， 转 义 字符 序列 用 于 定义 特 
殊 的 字符 并 被 函数 print( ) 解释 。 

使 用 单 引号 或 双 引 号 定义 字符 串 值 ， 必 须 在 一 行 中 定义 。 如 果 字 符 串 表 示 多 行文 本 ， 则 
有 两 种 实现 方法 。 第 一 种 方法 是 使 用 三 连 引 号 ， 例 如 下 列 艾 米 莉 . 狄 金森 的 诗歌 : 

>>> Toem =， 

To make a prairie it takes a clover and one bee， 

One clover, and a bee, 

And revery. 


The revery alone will do 


lf bees are few， 


i i f 

YY 网 和 R= T > 十 

让 我 们 观察 一 下 变量 poem 的 求 值 结 

之 这 这 poem 

'\nTo make a prairie it takes a clover and one bee, -\nO0ne clover 
， and a bee,\nAnd revery.\nThe revery alone will do\nIf bees are 
few. \n! 


这 是 男 一 个 包含 转 义 字符 序列 的 例子 。 转 义 字 符 序列 \n 表示 换行 字符 。 当 print() 
函数 的 字符 串 参 数 中 包含 换行 转 义 字符 序列 \n 时 ， 将 做 换行 处 理 : 


>>> print (poem) 


To make a prairie it takes a clover and one bee, - 
One clover, and a bee, 

And revery. 

The revery alone will do 

lf bees are fevw. 
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a 一 种 方法 是 显 式 编码 换行 字符 : 


>>> poenm = "\nlo make a& prairie 1t take a clover and one bee, -=\n\ 
One clover, and a bee, \nAnd Fw The revery alone\ 


Wiji doO\nIf Dees are Few.\n! 


4.1.2 深入 研究 索引 运算 符 
在 第 2 章 中 ， 我 们 介绍 了 索引 运算 符 [ ]: 


>>Z> 5S 三 hello” 

>>> SLO 

i 

索引 运算 符 带 一 个 参数 ， 即 索引 号 i， 返 回 字符 串 中 位 于 索引 i 位 置 的 单个 字符 组 成 的 
字符 串 。 


索引 运算 符 还 可 以 用 来 获取 一 个 字符 串 的 切片 〈 一 部 分 )。 例 如 : 


>>> s[0:2] 
en 


表达 式 s [0:2] 为 字符 串 s 从 索引 0 开始 到 索引 2 之 前 的 求 值 结果 (切片 )。 更 一 般 地 ， 
s[i:j] 是 字符 串 从 索引 主 开 始 到 索引 jj-1 结束 的 子 字 符 串 。 更 多 的 例子 如 下 (也 可 以 参 
见 图 4-1 ): 


>>> S[3:4] 

1 ， 

>>> s[-3:-1] 

1 

最 后 一 个 例子 说 明了 如 何 使 用 负 的 索引 号 获取 切片 : 子 字 符 串 从 索引 -3 开始 到 索引 -1 
之 前 ( 即 索引 -2 ) 结束 。 如 果 切 片 从 字符 串 的 第 一 个 字符 开始 ， 可 以 省 略 第 1 个 索引 : 


5% HL: 

ihe! 

要 获取 直到 字符 串 最 后 一 个 字符 结束 的 切片 ， 可 以 省 略 第 2 个 索引 : 

> 3] 

二 
倒 排 索 引 El, -3 区 

s h | e 守 虱 有 o 

索引 0 | 2 
s [0:2] ‘| | e 1 1 O 
s[3:4] h e 时 1 O 
s[-3:-1] h -es 法 O 


图 4-1 切片 。 表 达 式 s[0:2] 的 求 值 结果 为 字符 串 s 从 索引 0 开始 到 索引 2 之 前 结束 的 切 
片 。 表 达 式 s[ :2] 的 求 值 结果 与 表达 式 s[0:2] 的 求 值 结果 相同 。 表 达 式 s[3:4] 
等 价 于 s[3]。 表 达 式 s[-3:-1] 是 字符 串 s 从 索引 一 3 开始 到 索引 一 1 之 前 的 切片 


首先 执行 赋值 语句 : 
Ss 三 "Qi123486789' 
接着 使 用 字符 串 s 和 索引 运算 符 编 写 表 达 式 ， 要 求 求 值 结果 如 下 : 
La) 2 
(b}) 78 
(c) '1234567" 
对 
(8) "789" 


注意 事项 : 列表 切片 
索引 运算 符 是 字符 串 和 列表 类 共用 的 运算 符 之 一 。 索 引 运算 符 也 可 以 用 于 获取 一 个 列 
表 的 切片 。 例 如 ， 如 果 pets 定义 为 : 


>>7 pete 天 【goldtiah7 'cat's (dog 


则 可 以 使 用 索引 运算 符 获 取 pets 的 切片 : 


>>> pets[:2] 

['goldfish', cat'] 

>>> pets[-3:-1] 

['goldfish', :cat'] 

>>> pets[1:] 

[eat! s dog '] 

列表 的 切片 也 是 一 个 列表 。 换 言 之 ， 带 两 个 参数 的 索引 运算 符 作 用 于 一 个 列表 时 ， 结 

果 将 返回 一 个 列表 。 注 意 ， 这 与 仅 使 用 一 个 参数 的 索引 运算 符 作 用 于 一 个 列表 的 情况 不 
同 ,， 使 用 一 个 参数 时 ， 返 回 的 结果 是 位 于 索引 并 位 置 的 列表 的 项 。 


4.1.3 ”字符 串 方法 


字符 串 类 中 提供 了 数量 众多 的 方法 ， 这 些 方 法 为 开发 人 员 提 供 了 文本 处 理 的 工具 集 ， 可 
以 简化 文本 应 用 程序 的 开发 过 程 。 接 下 来 我 们 将 讨论 其 中 一 些 常 用 的 字符 串 方 法 。 

方法 find( )。 在 字符 串 s 上 使 用 一 个 输入 参数 target 调用 find( ) 方法 时 ， 该 方 
法 将 检查 target 是 否 是 s 的 子 字 符 串 。 如 果 是 ， 则 返回 字符 串 target 第 一 次 出 现 的 
位 置 索引 (第 一 个 字符 位 置 ); 否则 返回 1。 例如， 在 字符 串 message 中 使 用 目标 字符 
串 'top secret' 调用 方法 find() 的 方式 如 下 : 


>>> message = '''This message is top secret and should not 
be divulged to anvone without top secret clearance'"! 
>>> message.find('top secret') 


方法 find() 的 输出 结果 为 16， 因 为 'top secret' 在 字符 串 message 中 出 现 的 位 
置 从 索引 16 开始 。 

方法 count ( )。 当 使 用 输入 参数 target 在 字符 串 s 上 调用 count( ) 方法 时 ， 结 果 
返回 target 作为 子 字符 串 在 字符 串 s 中 出 现 的 次 数 。 例 如 : 


>>> message.count('top secret') 
2 
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结果 返回 2， 因 为 字符 串 'top secret' 在 message 中 出 现 了 2 次 。 
方法 replace()。 在 字符 串 s 上 调用 replace() 时 带 old 和 new 两 个 输入 参数 ， 
输出 结果 为 s 字符 串 的 一 个 副本 ， 其 中 所 有 的 子 字 符 串 ol1d 都 被 替换 为 字符 串 new。 例 如 : 


>>> pn replace('top', ‘no') 
[his message is no secret and should not\n 
pe divulged to anvone without vn Secret clearance 


et a 下 : 


>>> print(message) 
This message is top secret and should not 
be divulged to anyone without top secret clearance 


因此 字符 串 message 并 没有 被 replace( ) 方法 修改 。 结 果 返 回 的 是 相应 子 字 符 串 被 替代 
后 的 message 的 副本 。 返回 的 字符 串 随 后 即 无 法 访问 ， 这 是 因为 没有 为 其 赋予 一 个 变量 
名 - 通 币 ，replace() 方法 一 般 按 下 列 方式 在 赋值 语句 中 使 用 : 


>>> public = message.replace('top', 'no’) 

>>> print (public) 

This message is no secret and should not 

be divulged to anyone without no secret clearance 


请 回忆 一 下 ,字符 串 是 不 可 变 类 型 ( 即 不 能 被 更 改 )。 这 就 是 调用 字符 串 方 法 
replace() 返回 一 个 更 改 后 的 字符 串 副 本 ， 而 不 是 直接 更 改 原 字符 串 的 原因 。 在 下 一 个 例 
子 中 ,我 们 将 展示 其 他 一 些 返 回 更 改 后 的 字符 串 的 方法 

>>2> Mmessage = 'top secret 


>>> we Rea 


> 
>>> We i 
'TOP SECRET' 


方法 capitalize() 和 方法 upper()。 在 字符 串 s 上 调用 capitalizel() 时 ， 该 
方法 把 字符 串 s 的 第 一 个 字符 大 写 ; 而 方法 upper() 则 把 所 有 的 字符 大 写 。 

方法 split( )。 该 方法 非 第 有 用 ， 在 字符 串 上 调用 时 可 以 获取 和 学 符 串 的 单词 列表 : 

>>> 'this is the text' .split() 

Lehman rs "lry he's ext 

在 上 述 语 名 中， 方法 split() 使 用 子 符 囊 'this is the text' 中 的 空格 创建 子 
字符 串 并 构成 一 个 列表 返回 。 方 法 split() 还 可 以 带 一 个 分 隔 符 字符 串 作 为 输入 参数 来 调 
用 : 分 隔 符 字符 串 用 于 代 蔡 空格 来 拆 分 字符 串 。 例 如 ， 要 把 下 列 字 符 串 拆 分 成 数值 列表 : 


2 
可 以 使 用 ，;， 作为 分 隔 符 : 


> TY 
bs 》 , 臣 , 3 :bv 汪汪 


方法 translatel()。 该 方法 用 于 基于 字符 到 字符 的 映射 表 把 一 个 字符 串 中 的 某 些 字符 
符 换 为 必 一 些 字 人 符 。 上 映射 表 使 用 一 种 特殊 的 字符 串 方 法 来 构造 ， 其 调用 不 是 通过 字符 串 对 
象 ， 而 是 直接 使 用 str 类 本 身 : 


>>> table = str.maketrans('abcdef', 'uvwxyz') 


变量 table 表示 字符 a、b、 、f 到 字符 u、v、w、x、y、z 的 “映射 ”关系 。 
我 们 将 在 第 6 章 深 入 讨论 ee i 读者 只 需要 理解 其 用 作 方 法 translate() 
的 一 个 参数 : 


>>> 'fad' .translate (table) 


>>> 'desktop' .translate(table) 
SKY OP 


方法 translatel() 返回 的 字符 串 是 根据 table 描述 的 映射 关系 替换 对 应 字符 后 的 字 
符 串 副本 。 在 最 后 一 个 例子 中 ，Q 和 e 分 别 被 替换 为 x 和 y， 其 他 的 字符 则 保持 不 变 ， 因 为 
在 映射 表 table 中 没有 包括 其 他 字符 。 

表 4-1 列举 了 部 分 字符 串 方 法 。 还 有 更 多 的 方法 ， 可 以 使 用 help() 工具 查看 全 部 
方法 ; 


>>> help (str) 
表 4-1 字符 串 方法 。 注 意 ， 表 中 仅 列举 了 一 些 常用 的 字符 串 方法 。 由 于 字符 串 是 不 可 变 类 


型 ， 所 以 这 些 方法 都 不 会 改变 字符 串 s 的 值 。 方 法 count() 和 find() 返回 一 个 
整数 ， 方 法 split() 返回 一 个 列表 ， 其 他 方法 则 (通常 ) 返回 字符 串 s 的 一 个 修改 


后 副本 
用 法 返回 值 
s.Capitalize() 返回 字符 串 s 的 一 个 副本 ， 如 果 第 一 个 字符 是 字母 ， 则 大 写 
s.count (target) 返回 子 字 符 串 target 在 字符 串 s 中 出 现 的 次 数 
s.find(target) 返回 子 字符 串 target 在 字符 串 s 中 第 一 次 出 现 的 位 置 
s.lower!() 返回 字符 串 s 的 一 个 副本 ， 字 符 全 部 转换 为 小 写 
s.replace(old, new) 返回 字符 串 s 的 一 个 副本 ， 从 左 到 右 把 所 有 的 子 字 符 串 old 替换 为 子 字 符 串 new 
s.translate(table) 返回 字符 串 s 的 一 个 副本 ,根据 table 描述 的 映射 关系 ， 蔡 换 相应 的 字符 
et 返回 包含 字符 串 s 的 子 字符 串 的 列表 ， 使 用 分 隔 符 字符 串 sep 拆 分 字符 串 ; 默认 
的 分 隐 符 是 空格 
s.strip() 返回 字符 串 s 的 一 个 副本 ， 移 除 字符 串 s 前 后 的 空格 
Ss .upper() 返回 字符 串 s 的 一 个 副本 ， 字 符 全 部 转换 为 大 写 


假设 变量 forecast 被 赋值 为 如 下 字符 串 : 
Tt will be a sunny day today' 

请 根据 如 下 赋值 语句 描述 ， 编 写 Python 语句 : 

(a) 把 变量 count 赋值 为 字符 串 'day' 在 字符 串 forecast 中 出 现 的 次 数 。 

(b) 把 变量 weather 赋值 为 子 字 符 串 'sunny' 在 字符 串 forecast 中 出 现 的 索引 
位 置 。 

(c) 把 变量 change 赋值 为 字符 串 forecast 的 一 个 副本 ,其 中 所 有 的 子 字符 囊 
'sunny' 都 被 替换 为 'cloudy'。 
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4.2 格式 化 输出 

运行 一 个 程序 的 结果 通常 显示 在 屏幕 上 或 者 写 人 一 个 文件 中 。 无 论 哪 种 情况 ， 结 果 应 该 
以 一 种 视觉 上 有 效 的 方式 呈现 。Python 输出 格式 化 工具 有 助 于 实现 这 一 目标 。 在 本 节 中 ， 我 
们 将 学 习 如 何 使 用 print() 函数 和 字符 串 方 法 format ( ) 来 格式 化 输出 。 我 们 还 会 讨论 
如 何 创建 和 解析 包含 日 期 和 时 间 的 字符 串 。 


4.2.1 函数 print() 


函数 print ( ) 用 于 在 屏幕 上 输出 值 。 其 输入 参数 是 一 个 对 象 ， 输 出 结果 为 对 象 值 的 字 
符 事 表示 (我 们 将 在 第 8 章 讨论 对 象 的 字符 串 表示 )。 


3 
>>> print(n) 
5 


子 数 print() 可 以 市 任意 多 个 输入 对 象 参 数 ， 而 且 不 要 求 类 型 相同 。 所 有 对 象 的 值 输 
出 在 同一 行 ， 并 在 它们 之 间 插 入 空格 ( 即 字符 ' ') 进行 分 隔 。 

> F = .5/3 

>2>> print(n: r) 

5 1.66666666667 

>>> name = 'Tda’ 

>>> print(n, r;, name) 

5 1.66666666667 Ida 


输出 值 之 间 搬 入 的 空格 仅仅 是 软 认 分 隔 符 ， 也 可 以 指定 在 输出 值 之 间 择 人 分 号 来 代替 空 
格 。 除 了 输出 的 对 象 参 数 之 外 ，print() 函数 还 带 一 个 可 选 分隔 符 参数 “sep 7”: 


>>> print(n, r, name, sep=';') 
5;1.66666666667 ;Ida 


参数 “sep=' ;' ”指定 在 输出 变量 n、r 和 name 值 之 间 插 入 分 号 。 

总 而 言 之 ， 当 print ( ) 涵 数 增加 了 参数 “ sep=<some string>”， 则 在 输出 值 之 间 
插入 <some string>。 下 面 是 分 隔 符 的 一 些 示 例 。 如 果 和 希望 输出 值 使 用 ' ， (逗号 加 空 
格 ) 分 隔 ， 则 可 以 按 下 列 方式 书写 : 


>>> print(n, r, name, sep=', ') 
5，1.66666666667 ，Ida 


如 有 果 布 望 在 不 同 的 行 输出 每 一 个 值 ， 则 分 隔 符 应 该 为 换行 字符 '\n ' : 


>>> print(n, r, name, sep='\n') 
5 

1.66666666667 

Ida 


编写 一 个 语句 ， 在 同一 行 输出 变量 last、first 和 middle 的 值 ， 以 
水 平 制 表 符 分 隔 。( 水 平 制 表 符 的 Python 转 义 字符 为 \t。) 假设 各 变量 的 赋值 如 下 : 


>>> last = 'Smith'! 
> Tiret = JO 
>3> middle = Paul’ 


Smith John Paul 


除了 参数 sep 外 ， 了 遇 数 print() 还 支持 男 一 个 格式 化 参数 end。 通 常 ， 下 一 个 
print() 函数 调用 将 单独 在 另 一 行 输出 : 


ep FOF Wane Hn [Jog's Sm, Tih "Min 
print (name) 

Joe 

Sam 

Tim 

Ann 


产生 上 述 结果 的 原因 是 print ( ) 语句 默认 情况 下 在 所 有 要 被 输出 的 参数 后 面 附加 一 个 
参数 (新 行 \n)。 假 设 我 们 和 布 望 输出 结果 为 : 

Joe! Sam! Tim! Ann! 

当 输 出 参数 之 后 增加 了 参数 end=<some string>， 则 所 有 的 输出 参数 输出 之 后 ， 会 
输出 <some string>。 如 果 省 略 了 endq=<some string>， 则 会 使 用 默认 字符 串 \n (新 
行 字 符 串 )， 这 将 导致 结束 当前 行 而 开始 新 的 一 行 。 因 此 ， 要 在 屏幕 上 按 上 述 要 求 输出 ， 则 
需要 在 print() 哨 数 调用 中 增加 参数 “end = '! '”: 

255 £6 mame jn ['J00", Sam', ‘Timn', "Ani'J: 


print (name, end='! ') 


Joe! Sam! Timi! Ann! 


编写 函数 even ( ) ， 带 一 个 正 整 数 n 作为 输入 参数 ,在 屏幕 上 输出 位 于 2 
(包括 ) 和 nn 之 间 ， 能 被 2 或 3 整除 的 所 有 数 ， 输出 结果 格式 如 下 : 


>>> even(17) 
-0 


4.2.2 字符 串 方 法 format( ) 


print ( ) 函数 调用 中 增加 sep 参数 可 以 在 输出 值 之 间 插 入 相同 的 分 隔 符 。 但 是 ， 插 入 
相同 的 分 隔 符 有 时 候 不 能 满足 实际 需求 。 考 虑 如 下 情况 ， 给 定 各 个 日 期 和 时 间 变 量 ， 如 果 希 
望 按照 日 期 时 间 格式 输出 


>>> weekday = 'Wednesday 
>>> month = :March' 
>>> day = 10 


>>> year = 2010 
>>> hour = 11 

>>> minute = 45 
>>> second = 33 


如 果 和 希望 使 用 上 述 变 量 作为 输入 参数 调用 哺 数 print()， 并 输出 如 下 格式 内 容 : 
Wednesday, March 10, 2010 at 11:45:33 


很 显然 ， 我 们 使 用 分 隔 符 无 法 获取 这 种 输出 。 实 现 这 种 输出 的 一 种 方式 是 使 用 字符 串 拼 接 构 
造 正确 的 格式 : 
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>>> print(weekday+', '+month+' '+str(day)+', '+str(year) 
+' at '+str(hour)+':'+str(minute)+':'str(second)) 
SyntaxError: invalid syntax (<pyshell#36>, line 1) 


啊 ， 出 错 了 。 在 str(second) ma 个 + 号 。 尺 管 补充 + 号 就 可 以 修复 (请 时 刻 
检查 输入 内 容 ， 确 保 无 误 ! )， 但 我 们 并 不 满意 。 犯 错 的 主要 原因 在 于 所 采用 的 方法 十 分 枯燥 
且 容 多 出 销 。 还 有 一 or etre etree 字符 串 ( str) 类 提供 了 一 个 
强大 的 类 方法 format ( ) 用 于 此 目的 。 

format( ) 方法 在 一 个 表示 输出 的 格式 的 字符 串 上 调用 。format() 困 数 的 参数 是 要 
省 出 的 对 象 。 为 了 说 明 format ( ) 哺 数 的 用 法 ,我们 使 用 一 个 简化 的 日 斯 和 时 间 格 式 的 例 
子 (仅仅 输出 时 间 ): 


>>> '{0}:{1}:{2}' .format (hour, minute, second) 
“了 了 


要 输出 的 对 象 (hour 、 minute 和 second) 是 format( ) 方法 的 参数 。 调 用 format ( ) 
盟 数 的 字符 串 〈 即 ， ee {1}: {2}') 是 格式 化 字符 串 ， 用 来 描述 输出 格式 。 花 括号 外 面 的 所 
有 字符 ( 即 两 个 冒号 (':')) 将 直接 被 输出 。 花 括号 {0}、{1} 和 {2} 是 占 位 符 ， 对 应 于 要 
输出 的 对 象 。 gto 1 和 2 显 式 指定 这 些 占 位 符 分 别 对 应 format ( ) 函数 调用 的 第 一 个 、 第 
二 个 和 第 三 个 参数 。 示 意图 请 参见 4-2。 


: {2} 'format ( hour:s minute;, second ) 


图 4-2 输出 格式 化 。 format() 田 数 的 参数 值 在 由 花 括号 占 位 符 指定 的 位 置 输出 
图 4-3 描述 了 改变 上 例 中 索引 0、1 和 2 后 会 发 生 什 么 情况 : 


>>> '{2}:{0}:{1}' .format (hour, minute, second) 
"3 


format ( hou? 


a 


图 4-3 显 式 占 位 符 映 射 


默认 情况 下 ， 如 果 在 花 括 号 中 没有 显 式 指定 数值 ， 则 从 左 到 右 第 一 个 占 位 符 对 应 于 
format() 图 数 的 第 一 个 参数 ， 第 二 个 占 位 符 对 应 于 第 二 个 参数 ， 以 此 类 推 ， 如 图 4-4 
所 示 。 


>>> '{}:{}:{}'.format(hour, minute, second) 
1 


' Onat ( honr, minute, second 》 


图 4-4 默认 占 位 符 映射 


86 ”和 荔 了 章 


让 我 们 回 到 最 初 输出 日 期 和 时 间 的 目标 上 。 我 们 需要 的 格式 化 字符 串 为 : ' {}，{} {}， 
{} at {}:{}:{}'， 假设 调 用 format() 函数 依次 传人 的 变量 为 weekday 、month、 
dqay、yYyear 、hours 、minutes 和 seconds,。 

测试 检验 如 下 (有 关 变 量 和 占 位 符 的 映射 关系 描述 ， 请 参见 图 4-5 ): 


>>> print('{}, {} {}, {} at {}:{}:{}'.format(weekday, month, 
day, year, hour, minute, second)) 
Wednesday, March 10, 2010 at 11:45:33 


'{}, {} {}, {} at {}:{}:{}'.format (weekday, month, day, year, hour, minute, second) 


pr 
一 一 一 一 一 
-一 -一 一 
RPR 


图 4-5 日 期 和 时 间 变 量 到 占 位 符 的 映射 关系 


;3 了 :半天 ”假设 变量 first、last、street、number、city、state 和 zipcode 
均 已 经 被 赋值 。 编 写 一 个 打印 语句 ， 生 成 一 个 邮件 标签 : 
John Doe 


123 Main Street 
AnyCity, AS 09876 


假设 : 

>>> first = 'John' 

>>> last = 'Doe'! 

>>> street = 'Main Street' 
>>> number = 123 

>>> city = 'AnyCity ' 

>>> state = 'AS' 

>>> zipcode = '09876' 


4.2.3” 按 列 对 齐 排列 数据 


接 下 来 讨论 按 列 对 齐 “ 漂 亮 地 ”呈现 数据 的 问题 。 作 为 问题 的 动机 ,设想 邮件 客户 的 
From (发 件 人 )、Subject (主题 ) 和 Date (日 期 ) 字段 的 组 织 方 式 , 或 者 屏幕 上 显示 的 火车 或 
飞机 的 出 发 时 间 和 到 达 时 间 信 息 。 当 我 们 开始 处 理 大 量 数据 时 ， 有 了 时候 也 需要 以 按 列 对 齐 的 
方式 呈现 数据 。 

为 了 描述 这 个 问题 ， 让 我 们 考虑 针对 二 1,2,3,…， 上 整齐 输出 也 数 产 .六 和 2 的 值 的 问题 。 
整齐 输出 这 些 值 非常 有 用 ， 因 为 结果 可 以 描述 这 些 男 数 的 不 同 增长 率 : 


i i*A*2 i**3 人 水 水 工 
1 | LL 2 
2 4 8 
3 9 21 8 
4 16 64 16 
5 25 125 32 
6 36 216 64 
49 343 128 
8 64 512 256 
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9 81 729 512 
10 100 1000 1024 
11 Tet 1331 2048 
12 144 1728 4096 


那么 ， 如 何 获 得 这 种 输出 格式 呢 ?” 我 们 首先 尝试 使 用 print() 呐 数 的 sep 参数 ， 在 各 
行 的 不 同 值 之 间 插 入 适当 数量 的 空格 : 


> printt'1 ii# 冰 2 。 i##3 2##i') 
>3> fo jn Yange(l .13): 
print (i, i**2, i**3,，, 2**i，, sep=' 
省 出 结果 如 下 : 
i**2 i**3 2 水 水 工 
1 1 1 2 
2 和 8 = 
3 号 2 7 8 
中 16 64 16 
5 25 125 32 
6 36 216 64 
49 343 128 
8 64 512 256 
9 81 729 512 
10 100 1000 1024 
44 dt 1331 2048 
12 144 1728 4096 


虽然 前 几 行 的 格式 看 起 来 没有 问题 ， 但 是 我 们 发 现 同 一 列 的 数据 并 没有 很 好 地 对 齐 。 问 
题 的 根源 在 于 固定 大 小 的 分 隔 符 ， 当 某 一 项 的 数值 的 位 数 增加 时 ， 其 位 置 将 辕 右 偶 移 。 因 
此 ， 固 定 大 小 的 分 隔 符 不 能 胜任 该 任务 。 整 齐 呈 现 列 数据 的 正确 方法 是 保证 所 有 数值 的 位 一 
臻 对齐。 我 们 需要 的 是 把 每 列 数 值 的 宽度 固定 ， 然 后 使 用 右 对 齐 的 方式 输出 这 些 固 定 宽度 的 
数值 。 可 以 使 用 格式 化 字符 串 实现 该 功能 。 

在 格式 化 字符 串 的 花 插 号 中 ， 可 以 指定 映射 到 花 括 喜 占 位 人 符 的 值 的 呈现 方式 : 我 们 可 以 
指定 字段 宽度 (width)、 对 齐 方式 (alLignment)、 小 数 点 精度 (decimal Precision)、 
数据 类 型 (type)， 等 等 6 

我 们 可 以 使 用 一 个 十 进 制 整数 指定 (最 小 ) 字段 宽度 ,定义 值 的 保留 字符 数位 置 。 如 
利信 十 拓 总 东 者 疏 征 药 汪 肛 次 度 厅 名 则 字段 宽度 将 由 显示 值 的 数值 位 数 /字符 数 确定 。 
例如 : 

>>> '{0:3},{1:5}' .format(12, 354) 

2 

在 上 例 中 ， 我 们 输出 整数 值 12 和 354。 格 式 化 字符 串 中 12 的 占 位 符 为 {0 :3}。0 表示 
format( ) 函数 的 第 一 个 参数 ( 即 12 )， 如 前 所 述 。' :' 后 的 内 容 用 于 指定 值 的 格式 。 在 这 
个 例子 中 ，3 表示 占 位 符 的 宽度 应 该 为 3。 因 为 12 是 一 个 两 位 数 的 数值 ， 因 此 在 前 面 添 加 了 

一 个 额外 的 空格 。354 的 占 位 符 包 括 '1:5'， 因 此 在 354 前 面 添 加 了 2 个 空格 。 

当 字 段 宽 度 大 于 数值 的 位 数 时 ， 默 认 情 况 下 右 对 齐 〈 即 把 数值 靠 在 对 齐 )。 字 符 串 是 左 
对 齐 。 在 下 一 个 例子 中 ， 为 参数 first 和 1ast 保留 的 字段 宽度 为 10 个 字符 。 注 意 多 余 的 
空格 添加 到 字符 串 值 的 后 面 


>>% Ire = “Bill" 

2>> Jast = 'Gates' 

S35> "110F{:10}' format (firvet, 1ast) 

"Bill Gates 

精度 ( precision) 是 指定 浮 点 值 的 小 数 点 前 后 显示 位 数 的 十 进 制 数 。 它 位 于 字段 宽度 之 
后 ， 用 逗号 分 隔 。 在 下 一 个 例子 中 ,字段 宽度 为 8， 但 只 显示 4 位 浮 点 数值 : 


>>> :{:8.4}+5.format(1000 / 3) 


Me 


比较 无 格 式 化 的 输出 1 结 : 


>>> 1000 7 3 
333.3333333333333 


类 型 (type) 决定 值 呈现 的 方式 。 整 数 的 呈现 方式 类 型 如 表 4-2 所 示 。 


表 4-2 整数 的 呈现 方式 类 型 
类 型 说 明 


b 以 二 进 制 形式 输出 数值 

c 输出 整数 值 所 对 应 的 Unicode 字符 

d 以 十 进 制 形式 输出 数值 (默认 方式 ) 

O 以 八进制 形式 输出 数值 

x 以 十 六 进 制 形式 输出 数值 ， 如 果 数 字 超 过 9， 则 以 小 写字 母 显 示 
X 以 十 六 进 制 形式 输出 数值 ， 如 果 数 字 超 过 9， 则 以 大 写字 母 显 示 


以 整数 10 为 例 ， 其 不 同 的 整数 类 型 选项 摘 述 如 下 : 


> 
>>> '{:b}' .format (n) 


“0 

>>> '{:c}'.format(n) 
\n 

>>> ‘{:d}' .format(n) 

11( 

> {ER}' format(n) 

pn 


浮 点 数 的 呈现 方式 选项 有 两 种 : £ 和 e@e。 类 型 选项 f£ 把 值 显示 为 定点 数 ( 即 包括 小 数 点 
和 小 数 部 分 )。 


>>> '{:6.2f}' .format(5 / 3) 


在 上 例 中 ,格式 化 规格 ' :6 .2f' 保留 最 小 宽度 为 6， 正 好 2 位 小 数 ， 把 浮 点 数值 表述 
为 定点 数 。 类 型 选项 e 表述 科学 计数 法 ， 指 数 部 分 显示 在 字符 e 之 后 : 

>>> ‘'{ie}',. formatt5 / 3) 

1.666667e+00， 
即 结 果 表 示 1.666667 x 10 。 

现在 让 我 们 回 到 最 初 问题 : Ey 2，3，…，12， 显 示 函 数 产 、 廊 、2' 的 值 。 我 们 
为 i 的 值 指定 最 小 宽度 3， 为 站、 六 、2' 的 值 指定 最 小 宽度 6， 以 获得 期 望 的 格式 。 


模块 : ch4.py 


def growthrates(n): 
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DEiNte Values v1 elod 3 LUnctions Tor 1 三 了 
print(" i 炒米 名 i 来 来 村 Dx*x* 主 ! ) 
formatesti = 052d {le A264 3:€4d4}! 


for 1 in Yanvet(l2, nti 
print (formatStr.format (i , **2, 二 #k 冰 3 ， 2**i)) 





实现 函数 zoster()， 带 一 个 包含 学 生 信息 的 列表 作为 输入 参数 ， 输 出 
业 直 所 示 萝 范 各 凡 。 学 生 信息 包含 学 生 的 姓 、 名 、 班 级 和 平均 课程 成 绩 ， 按 顺序 保存 在 一 个 
列表 中 。 因 此 ， 输 入 参数 为 一 个 列表 的 列表 。 请 确保 花 名 册 输 出 的 每 个 字符 串 值 包 含 10 个 
字符 人 位置， 成绩 包含 8 个 占 位 字符 (包括 2 个 小 数 点 位 )。 


>>> students = [] 
>>> students.append(['DeMoines', 'Jim', 'Sophomore', 3.45]) 
>>> Students .append([， WE 'Sophie'，'Sophomore'，4.0]) 


>>> students.append(['Columbus', 'Maria', 'Senior', 2.5]) 
> SG -oppoditl enix', River', 'Junior', 2.45]) 
>>> Sn ro te Eqgar' "JIinior's S990]) 
>>> roster(students) 

Last First Class Average Grade 

DeMoines Jim Sophomore 3.45 

Pierre Sophie Sophomore 4.00 

Columbus Maria Senior 2.50 

Phoenix River Junior 2.45 

Dlympia Edgar Junior 3.99 


4.2.4 获取 与 格式 化 日 期 和 时 间 


程序 常常 需要 解析 或 者 产生 包含 日 期 和 时 间 的 字符 串 。 男 外 ， 还 需要 获取 当前 时 间 。 当 
前 日 期 和 时 间 可 以 通过 “查询 ”底层 操作 系统 获取 。 在 Python 语言 中 ，time 模块 提供 了 操 
作 系 统 时 间 功 能 的 API 接口 ， 以 及 格式 化 日 期 和 时 间 的 工具 。 为 了 了 解 如 何 使 用 它 ， 我们 
首先 导入 七 ime 模块 : 


>>> ‘import time 


time 模块 中 包含 大 二 返回 当前 时 间 不 同 版 本 的 了 浮 数 。time( ) 因数 返回 从 纪元 开始 经 
过 的 时 间 (以 秒 为 单位 ): 


>>> time .time() 
1268762993 .335 


通过 为 一 个 函数 ， 可 以 返回 与 time( ) 格式 完全 不 同 的 时 间 ， 从 而 可 以 查看 当前 计算 
机 系统 的 纪元 : 


>>> time .gmtime(O) 
time.struct_time(tm_year=1970, tm_mon=1, tm_mday=1, tm_hour= 
0, tm_min=0, tm_sec=0, tm_wday=3, tm_yday=1, tm_isdst=0) 


知识 拓展 : 纪元 、 时 间 、UTC 时 间 
计算 机 记录 时 间 的 方式 是 记录 从 某 个 时 间 点 (纪元 ) 开始 所 经 过 的 秒 数 。 在 UNIX 
和 基于 Linux 的 计算 机 (包括 Mac OS 义 )， 纪 元 开始 于 格林 尼 治 时 间 1970 年 1 月 1 日 
00:00:00 。 


为 了 记录 自 纪元 开始 所 经 过 的 准确 秒 数 ， 计 算 机 需要 知道 一 秒 钟 是 多 长 时 间 。 每 个 计 
算 机 在 其 中 央 处 理 器 (CPU) 中 有 一 个 石英 钟 可 以 用 于 此 目的 (还 可 以 控制 “时 钟 周期 ” 
的 长 度 )。 但 是 石英 钟 存 在 着 并 不 是 “十 分 准确 ”的 问题 ， 每 隔 一 段 时 间 后 会 与 “实际 时 
间 ” 产 生 偏 离 。 这 对 于 当今 的 联网 计算 机 而 言 是 一 个 问题 ， 因 为 许多 互联 网 应 用 程序 要 求 
计算 机 时 间 同 步 (至 少 误差 较 小 )。 

当今 的 联网 计算 机 的 石英 钟 会 与 互联 网 上 的 时 间 服 务 器 保持 同步 ， 时 间 服 务 器 的 工作 
是 提供 称 之 为 “协调 世界 时 间 、 世 界 统 一 时 间 、 世 界 标准 时 间 、 国 际 协 调 时 间 ， 或 UTC 
时 间 ” 的 “官方 时 间 ” 的 服务 。UTC 是 大 约 12 个 原子 钟 的 平均 时 间 ， 在 格林 尼 治 英国 旺 
家 天 文 全 ,被 用 来 追踪 平均 太阳 时 (基于 地 球 绕 太 阳 旋 转 )。 

借助 互联 网 上 的 时 间 服 务 器 提供 的 这 种 国际 认可 的 标准 时 间 服 务 ， 计算机 才能 保持 一 
致 的 时 间 (在 很 小 的 误差 范围 之 内 )。 


国 数 gmtime() 返 回 的 对 象 类 型 为 time.struct time,， 它 是 一 个 类 似 元 组 的 类 
型 。 虽 然 这 个 类 型 有 些 陌生 ,但 查看 纪元 ( 即 纪 元 开始 后 的 0 秒 的 时 间 ) 并 不 困难 ， 即 
1970 年 1 月 1 日 00:00:00 UTC。 这 是 UTC 时 间 ， 因 为 给 定 一 个 整数 作为 输入 参数 s， 郴 数 
gmtime() 返回 自 纪 元 开始 s 秒 后 的 UTC 时 间 。 如 果 没 有 指定 参数 ， 则 了 哨 数 gmtime() 
返回 当前 UTC 时 间 。 关 联 的 限 数 localtime() 返回 本 地 时 区 的 当前 时 间 : 

>>> time.localtime() 

time.struct_time(tm_year=2010, tm_mon=3, tm_mday=16, tm_hour= 

13, tm_min=50, tm_sec=46, tm_wday=1, tm_yday=75, tm_isdst=1) 
输出 格式 的 可 读 性 并 不 好 (因为 设计 的 目的 不 在 于 此 )。 模 块 time 提供 了 一 个 格式 化 清 数 
strftime() 可 以 按期 望 的 格式 输出 时 间 。strftime() 图 数 带 一 个 格式 化 字符 串 人 参数 和 
gmtime() 或 1ocaltime() 返 回 的 时 间 参 数 ， 按 格式 化 字符 串 描述 的 格式 输出 时 间 。 下 
面 给 出 一 个 例子 (参见 图 4-6 ): 


>>> time.strftime('%A %b/%d/%y %I:%M %p', time.localtime()) 
'Tuesday Mar/16/10 02:06 PM' 


Tuesday Mar 大 区 / 10 02 ; 06 PM 


图 4-6 映射 指令 。 根 据 表 4-3 中 的 映射 关系 ， 在 输出 字符 串 中 ， 指 令 SA、%b、%d、%y、%I、%M 
和 %p 映射 到 日 期 和 时 间 值 


在 上 例 中 ，strftime() 根据 格式 化 字符 串 '%$A %b/%d/%y %I:%M gsp' 中 指定 的 格式 
输出 上 time.lLocaltime() 返回 的 时 间 。 格 式 字 符 串 中 包含 了 指令 $A、%b、%d、%y、%I、%M 
和 %p， 指 定 日 期 和 时 间 值 在 指定 位 置 输出 ， 其 映射 关系 参见 表 4-3。 格 式 化 字符 串 中 的 其 他 字 
符 (/、: 和 空格 ) 则 原样 复制 到 输出 结果 。 
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表 4-3 时间 格式 字符 串 指令 。 其 中 仅 列 举 了 一 些 常 用 的 时 间 和 日 期 格式 化 指令 


指 令 输 出 
$a 星期 名 称 的 缩写 
$A 星期 名 称 的 全 称 
g%b 月 份 名 称 的 缩写 
$B 月 份 名 称 的 全 称 
sd 月 份 中 的 天 ， 十进制 01 和 31 之 间 
%H 小 时 ， 数 值 00 和 23 之 间 
%I 小 时 ， 数 值 01 和 12 之 间 
g%M 分 钟 ， 数 值 00 和 59 之 间 
%P AM 或 PM 
%S 秒 ， 数 值 00 和 61 之 间 
8y 年 ， 不 带 世 纪 ， 数 值 00 和 99 之 间 
aY 年 ， 十 进 制 数 
%2 时 区 名 称 

首先 设 定 七 为 本 地 时 间 : 自 1970 年 1 月 1 日 UTC 开始 1500 000 000 秒 : 





>>> import time 
>>> 七 = time.localtime(1500000000) 


使 用 字符 串 时 间 格 式 化 函数 strftime() 构建 如 下 字符 串 : 


(a) 'Thursday, July 13 2017' 
(b) '09:40 PM Central Daylight Time on 07/13/2017' 
(c) 'I will meet you on Thu July 13 at 09:40 PM.' 


4.3 ”文件 


文件 是 存储 在 辅助 存储 器 设备 (如 磁盘 驱动 器 ) 上 的 字 节 序列 。 文 件 可 以 是 文本 文档 或 
电子 表格 ， 也 可 以 是 HTML 文件 或 Python 模块 。 这 些 文 件 称 为 文本 文件 。 文 本 文件 包含 一 
系列 使 用 某 种 编码 (例如 ，ASCII、UTF-8 等 ) 进行 编码 的 字符 。 一 个 可 
执行 的 应 用 程序 jp ra exe)、 一 个 图 像 或 一 个 音频 文件 。 这 些 文 件 被 称 为 二 进 制 文 

， 因 为 它们 只 是 一 节 友 列 ， 没 有 编 公 。 

ee A 接 下 来 进行 介绍 。 


4.3.1 文件 系统 


文件 系统 是 计算 机 系统 的 组 成 部 分 ， 它 组 织 文件 并 提供 创建 、 访 问 和 修改 文件 的 方法 。 
虽然 文件 可 以 物理 存储 在 各 种 辅助 (硬件 ) 存储 设备 上 ， 但 文件 系统 提供 了 文件 的 统一 视图 ， 
隐藏 了 文件 如 何 存储 在 不 同 硬件 设备 上 的 差异 。 这 将 导致 读 或 写 文件 的 方式 都 是 相同 的 ,无 
论文 件 存储 在 硬盘、 闪存 ， 还 是 DVD-RW。 

文件 被 分 组 到 目录 或 文件 夹 中 。 文 件 夹 除了 包含 (常规) 文件 外 ， 还 可 以 包含 其 他 文件 
夹 。 文 件 系统 将 文件 和 文件 夹 组织 成 树 形 结构 。Mac OS X 文件 系统 组 织 如 图 4-7 所 示 。 按 
照 计算 机 科学 中 的 惯例 ， 采 用 倒置 方式 绘制 树 状 层次 结构 ， 树 的 根 位 于 顶部 。 

树 形 层次 结构 顶部 的 文件 夹 称 为 根 目 录 。 在 UNIX、Mac OS X 和 Linux 文件 系统 中 ， 根 


只 2 锣 了 莫 


文件 夹 被 命名 为 / ; 在 MS Windows 操作 系统 中 ， 每 个 硬件 设备 都 有 上 自己 的 根 目 录 (例如 ， 
c:\)。 文 件 系 统 中 的 每 个 文件 夹 和 文件 都 有 一 个 名 称 。 但 是 ， 名 称 不 足以 有 效 地 定位 文件 。 
每 个 文件 可 以 通过 路 径 名 指定 。 使 用 路 径 名 可 以 有 效 地 查找 文件 。 文 件 路 径 可 以 以 两 种 方式 
指定 。 


Applications bin Users Var 
Firefox.app Python 3.1 date Shared lperkovic 


example.txt chin.txt 
图 4-7 Mac OS X 文件 系统 组 织 。 文 件 系统 中 包括 文本 文件 (例如 ，example.txt 和 chin. 
txt)、 二 进 制 文件 (如 ，date) 和 文件 夹 (矩形 框 )， 它 们 组 织 成 一 棵 树 形 层次 结构 ; 
树 的 根 是 一 个 名 为 / 的 文件 夹 。 图 中 显示 了 文件 系统 的 一 小 部 分 ， 文件 系 统 通 党 包括 
成 千 上 万 的 文件 夹 和 数量 众多 的 文件 


文件 的 绝对 路 径 名 包含 从 根 目 录 开 始 、 过 爵 到 该 文件 的 文件 夹 的 序列 。 绝 对 路 径 名 表示 
为 一 个 字符 串 ， 其 中 文件 夹 序列 使 用 斜 枉 (0/ ) 或 反 斜 杠 (\) 分 隔 (取决 于 操作 系统 )。 

例如 ，Python 3.1 文 件 夹 的 绝对 路 径 是 : 

/Applications/Python 3.1 

而 文件 example.txt 的 绝对 路 径 是 : 

/Users/lperkovic/example.txt 

上 述 是 Unix .Mac OS X 和 Linux 机 带 的 情况 。 在 Windows 机 禹 上 ， 笠 杠 用 反 斜 杠 代 符 ， 
而 根 目 录 名 (“第 一 个 反 斜 杠 ”) 则 使 用 c:\ 代替 。 

计算 机 系统 执行 的 每 个 命令 或 程序 都 与 当前 工作 目录 相关 联 。 当 使 用 命令 行 时 ， 当 前 工 
作 目 录 通 常 在 命令 行 提示 符 下 列 出 。 当 执行 Python 模块 时 ， 当 前 工作 目录 通常 是 包含 模块 
的 文件 夹 。 在 交互 式 命令 行 中 运行 Python 模块 之 后 (例如 ， 通 过 在 IDLE 交互 式 命令 行 中 按 
下 【F5 】)， 则 包含 该 模块 的 文件 夹 将 成 为 后 续 交 互 式 命令 行 的 当前 工作 目录 。 

文件 的 相对 路 径 是 从 当前 工作 目录 开始 过 有 历 到 该 文件 的 文件 夹 序 列 ， 如 订 当 前 工作 目录 
是 Users， 则 图 4-7 中 的 文件 example .txt 的 相对 路 径 名 是 : 

lperkovic/example.txt 

如 果 当 前 日 录 是 lperkovic， 则 可 执行 文件 aate 的 相对 路 径 名 是 : 

../../bin/date 

双人 句点 符号 (..) 用 于 引用 父 文件 夹 ， 它 是 包含 当前 工作 目录 的 文件 夹 。 


4.3.2 打开 和 关闭 文件 


处 理 一 个 文件 包括 如 下 三 个 步 又 ， 
1. 打开 用 于 读 或 写 的 文件 。 
2. 从 文件 中 读 取 内 容 和 /或 写 信 数据 到 文件 。 
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3. 天 财 文件 。 
内 置 函 数 open ( ) 用 于 打开 一 个 文件 ,不管 是 文本 文件 还 是 二 进 制 文件 。 为 了 读 取 文 
件 example.txt， 首 先 必须 要 打开 它 : 


ijnfile = open('example.txt', Br cl 


中 数 open( ) 包括 三 个 字符 串 参 数 : 文件 名 、 打 开 模 式 (mode， 可 选 ) 和 编码 (可 选 )。 
我 们 将 在 第 6 曹 讨 论 编 码 参 数 。 文 件 名 实际 上 是 要 打开 的 文件 的 路 径 (绝对 路 径 或 相对 路 
径 )。 在 上 例 中 ， 使 用 的 是 相对 路 径 example.txt。Python 将 在 当前 工作 路 径 (回顾 前 述 
内 容 ， 包 含 上 次 导入 模块 的 文件 夹 ) 中 查找 名 为 example.txt 的 文件 。 如 果 文 件 不 存在 ， 
则 抛 出 腊 第 。 例 如 : 


>>> infile = open('sample.txt') 
Traceback (most recent call last): 
File "<pyshell#339>", line 1, in <module> 
infile = open('sample.txt') 
IOError: [Errno 2] No such file or directory: ‘sample.txt' 


义 件 名 也 可 以 是 文件 的 绝对 路 径 ， 例 如 ， 在 UNIX 机 各 上 为 : 
/Users/lperkovic/example .txt 
在 Windows 机 谷 上 则 为 : 


C:/Users/lperkovic/example.txt 


注意 事项 : 文件 系统 路 径 使 用 斜 杠 还 是 反 斜 杠 ? 
在 UNIX、Linux 和 Mac OS X 系统 中 ， 在 路 径 中 使 用 斜 杠 (/ ) 作为 分 隔 符 。 在 微软 
Windows 系统 中 ， 则 使 用 反 斜 本 (/) 作为 分 隔 符 : 


C:\Users\lperkovic\example.txt 


也 就 是 说 , Python 将 接受 Windows 系统 中 使 用 斜 杠 (/) 的 路 径 。 这 是 一 个 相当 棒 的 功能 ， 
因为 在 一 个 字符 串 中 ， 反 针 杠 (\) 被 解释 为 转 义 序列 的 开始 。 


打开 模式 ( mode) 是 一 个 字符 串 ， 用 于 指定 如 何 与 打开 的 文件 进行 交互 。 在 函数 调用 
open('example.txt',，,，'r') 中 ,打开 模式 'r' 表示 打开 文件 用 于 读 取 内 容 ; 同时 还 
规定 ， 该 文件 将 作为 文本 文件 被 读 取 。 

一 般 而 言 ， 打 开 模 式 字 符 串 会 包含 +、w、a 或 r+ 之 一 ,分别 表示 打开 文件 用 于 读 取 、 
与 人 、 附 加 、 读 取 并 写 人 。 如 果 没 有 指定 ， 黑 认 值 为 上 。 另 外， 打开 模式 字符 串 中 还 允许 
使 用 字符 七 和 b, 七 表示 文件 是 文本 文件 ， 而 b 表示 文件 是 二 进 制 文件 。 如 果 两 者 都 没有 
被 指定 ， 则 默认 为 t。 因 此 ，open('example.txt'，'r') 等 价 于 open('example. 
txt": "rt'); 也 每 价 于 open(t"example.txt')s 文件 打开 模式 的 总 结 如 表 直 4 
所 示 。 

表 4-4 文件 打开 模式 。 文 件 打开 模式 是 描述 文件 使 用 方式 的 字符 串 : 读 取 、 写 入 、 读 取 并 

写 入 ; 按 字 节 读 取 、 使 用 文本 编码 方式 读 取 










污 取 模式 (默认 ) 
写 和 人 模式 ; 如 果 文 件 已 经 存在 ， 则 清除 原 内 容 


( 续 ) 
模 式 描 述 
a 附加 模式 ; 将 数据 内 容 附加 写 入 到 文件 未 尾 
r+ 读 取 并 写 入 模式 (超出 本 教程 讨论 范围 ) 
七 文本 模式 (默认) 
b 二 进 制 模 式 


将 文件 作为 文本 文件 或 二 进 制 文件 打开 的 区 别 在 于 ， 二 进 制 文件 被 视 为 字 节 序列 ， 在 
读 取 时 不 进行 解码 ， 在 写 人 时 不 进行 编码 。 然 而 ， 文 本 文件 被 当 作 使 用 某 种 编码 的 编码 
交行 5 
open( ) 图 数 返 回 一 个 输入 或 输出 流 类 型 的 对 象 ， 支 持 读 取 和 /或 写 人 字符 的 方法 。 我 
们 把 这 种 对 象 被 称 为 文件 对 象 。 不 同 的 文件 打开 模式 返回 不 同文 件 类 型 的 文件 对 象 。 根 据 文 
件 打 开 的 不 同 模式 ， 所 返回 的 文件 类 型 将 支持 表 4-5 中 描述 的 全 部 或 部 分 方法 。 
表 4-5 文件 对 象 方法 。 文件 对 象 (例如 ，open() 函数 返回 的 对 象 ) 支持 表 4-5 中 的 方法 


方法 用 法 解释 说 明 
cy 从 文件 infile 中 读 取 n 个 字符 ,或 者 直到 文件 末尾 ， 并 把 读 取 的 字符 作为 一 个 字符 串 
infile.read(n) E 
返回 
infile.read() 从 文件 infile 中 读 取 全 部 字符 (直到 文件 末尾 )， 并 把 读 取 的 字符 作为 一 个 字符 串 返 回 


从 文件 infile 中 读 取 一 行 数据 ， 直 到 (包括 ) 换行 符 ， 或 者 直到 文件 未 尾 ， 并 把 读 取 
的 字符 作为 一 个 字符 串 返 回 
infile.readlines() 从 文件 infile 中 读 取 数据 ， 直 到 文件 未 尾 ， 并 把 读 取 的 字符 作为 一 个 行 数据 的 列表 返回 


infile.readlinel() 


outfile.writel(s) 把 字符 串 s 写 入 到 文件 outfile 
file.closel() 关闭 文件 


不 同 的 读 取 方法 用 于 以 不 同 的 方式 读 取 文件 的 内 容 。 以 example .txt 文件 为 例 说 明 
三 者 的 差异 。 假 设 example.txt 的 内 容 是 : 


文件 : example.txt 


The 3 lines in this file end with the new line character. 


3 There is a blank line above this line. 


首先 把 文件 作为 文本 输入 流 打 开 ， 用 于 进行 读 取 : 


>>> infile = open('example .txt') 


对 于 每 个 打开 的 文件 ， 文 件 系统 将 关联 一 个 指向 文件 中 茶 个 字符 的 游标 。 当 文件 第 一 次 
打开 时 ， 游 标 通常 指向 文件 的 开头 〈 即 文件 的 第 一 个 字符 )， 如 图 4-8 所 示 。 读 取 文 件 时 ， 读 
取 的 字符 是 从 游标 开始 的 字符 ; 如 果 我 们 正在 写 入 文件 ， 那 么 我 们 的 任何 内 容 都 将 从 游标 位 
置 开 始 写 人 。 

现在 使 用 read( ) 函数 读 取 一 个 字符 。read( ) 浮 数 将 把 文件 中 的 第 一 个 字符 作为 字符 
串 〈 仅 包含 一 个 字符 的 字符 串 ) 返回 。 


>>> infile.read(1) 


rr 
人 
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The 3 lines in this file end vwitk the new line charac 


re is a blank line above this ] 
Sre 15 a Dianx Ine aoDcoVe TNn1Ss li1ine. 


this file end with the new line charact 
调用 read(1) 之 后 : 


k line above this line. 


调用 read(5) 之 后 : 


调用 readline( ) 之 后 : 


调用 read( ) 之 后 ; 





图 4-8 ” 读 取 文件 example.txt。 读 取 文 件 时 ， 游 标 随 字符 被 读 取 而 移动 ， 并 有 旦 一 直 指 问 下 一 
未 读 取 的 字符 。 执 行 read(1) 之 后 ,字符 'T' 被 读 取 ， 游 标 移动 并 指 问 'h'。 
read(5) 之 后 ,字符 串 'he 31' 被 读 取 ， 游 标 移 动 并 指 回 '1'。 执 行 readline() 
之 后 ， 第 一 行 剩余 的 内 容 被 读 取 ， 游 标 移动 并 指向 第 二 行 的 开头 ， 第 二 行为 空 (除了 
换行 符 ) 
WT we 即 'h' ( 即 第 一 个 未 读 取 字符 )， 
如 图 4-8 所 示 。 让 我 们 再 次 调用 read( ) 因数 ， 这 次 读 取 5 个 字符 。 返 回 的 结果 是 最 初 读 取 
的 字符 'T' 之 后 的 5 个 字符 构成 的 字符 串 : 


>>> infile.read(5) 
i 


函数 readline( ) 将 从 文件 中 读 取 字符 直到 行 尾 ( 即 换行 字符 \n) 或 者 文件 结尾 。 注 
意 ， 上 例 中 readline( ) 返回 的 字符 串 的 最 后 一 个 字符 是 换行 符 : 


>>> infile.readline() 


Janes in this file end with the new line character., \n 


现在 ， 游 标 指 回 第 二 行 的 开头 ， 如 图 4-8 所 示 。 最 后 ， 我 们 使 用 不 带 参 数 的 read( ) 读 
取 文 件 中 剩余 的 内 容 : 


>»5> infile,.read() 


'\nThere is a blank line above this Line .VM\n' 


现在 ， 游 标 指 向 “文件 结尾 ”(EOF) 字符 ，EOF 指示 文件 结束 。 
要 关闭 infile 所 指 回 的 打开 文件 ， 可 以 使 用 如 下 语句 : 


infile.close() 


关闭 文件 将 释放 跟踪 打开 文件 的 信息 ( 即 游标 位 置信 息 ) 的 文件 系统 资源 。 


注意 事项 : 结束 符 
如 果 一 个 文件 被 当 作 二 进 制 文件 来 读 取 和 写 入 ， 则 文件 只 是 一 个 字 节 序列 ， 不 存在 行 


的 概念 。 因 此 一 种 编码 必须 存在 一 个 换行 的 码 ( 即 换行 符 )。 在 Python 语言 中 ， 换 行 符 表 
示 为 转 义 字符 序列 \n。 然 而 ,文本 文件 的 格式 与 计算 机 系统 平台 有 关 ， 不同 的 操作 系统 
使 用 不 同 的 字 节 序列 编码 一 个 新 行 : 

。MS Windows 使 用 \r\n 两 个 字符 序列 。 

。Linux/UNIX 和 Mac OS X 使 用 \n 字符 序列 。 

。Mac OS 版 本 9 (包括 ) 之 前 使 用 \r 字符 序列 。 

当 进 行 读 取 操作 时 ，Python 将 与 平台 相关 的 行 结 束 符 转换 为 \n ; 当 进 行 写 入 操作 时 ， 

Python 将 \n 转换 为 与 平台 相关 的 行 结束 符 。 通 过 这 种 转换 ，Python 实现 了 与 平台 无 关 的 
特性 。 本 


4.3.3 读 取 文本 文件 的 模式 

Python 根据 用 户 需要 对 文件 进行 什么 操作 ， 提 供 以 下 几 种 不 同 的 方法 以 用 于 访问 文件 
内 容 并 为 其 处 理 做 准备 。 接 下 来 将 具体 描述 这 几 种 打开 要 读 取 的 文件 和 读 取 文件 内 容 的 模 
式 。 我 们 将 再 次 使 用 文件 example .txt 说 明 这 些 模 式 。example .txt 的 内 容 如 下 : 


,There is a blank line above this line. 

访问 文本 文件 的 一 种 方法 是 把 文件 的 内 容 读 取 到 一 个 字符 串 对 象 。 这 种 模式 适合 于 文件 
不 是 太 多 的 情况 ， 可 以 使 用 字符 串 操作 来 处 理 文件 内 容 。 例 如 ， 这 种 模式 可 以 用 于 查找 文件 
内 容 ， 或 把 一 个 子 字符 串 替换 为 为 一 个 字符 串 。 

我 们 通过 实现 函数 numchars ( ) 来 描述 该 模式 。numchars ( ) 市 一 个 文件 名 作为 输入 
参数 ， 返 回 文件 中 的 字符 个 数 。 我 们 使 用 read( ) 郴 数 把 文件 内 容 读 取 到 一 个 字符 串 : 


模块 : ch4.py 


def numChars (filename).: 
' 返回 文件 各 LIename 中 的 字符 个 数 ， 
infile = open(filename, ‘r') 
content = infile.read() 
infile.close() 


return len(content) 


针对 example .txt 文件 调用 该 图 数 ， 结 有 末 如 下 : 


>>> numChars('example .txt ) 
98 





一: 本 温 编 写 函 数 stringCount()， 带 2 个 字符 串 作 为 输入 参数 : 文件 名 和 目标 字符 
串 ， 返 回 目标 字符 串 在 文件 中 出 现 的 次 数 。 
>>> stringCount('example.txt', '1it 
4 


YA 


接 下 来 要 讨论 的 文件 读 取 模式 适用 于 处 理 文件 中 的 单词 。 要 访问 文件 中 的 单词 ， 可 以 该 
取 文 件 内 容 到 一 个 字符 串 ， 然 后 使 用 split ( ) 因数 的 默认 形式 把 也 容 拆 分 为 一 个 单词 列表 。 
(因此 ， 我 们 在 该 例 中 关于 单词 的 定义 仅仅 是 连续 的 非 空 字符 序列 。) 我 们 通过 下 一 个 函数 捅 
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述 该 模式 ， 该 限 数 返回 文件 中 的 单词 个 数 。 它 还 输出 这 些 单词 列表 ， 以 便 观 察 单 词 列表 。 
模块 : ch4.py 


def numWords (filename) : 
' 返回 文件 filename 中 的 单词 个 数 ， 
infile = open(filename, 'r') 
content = infile.read() # 读 取 文件 内 容 到 一 个 字符 串 
infile.close() 


wordList = content.split() # 把 文件 拆 分 为 单词 列表 
print (wordList) # 同时 输出 单词 列表 
return len(wordList) 


在 example .txt 上 运行 该 程序 的 输出 结果 如 下 : 


>>> DumWords('example.txt') 


LA Ta YS i 
Ethie "New's LIne , ‘charactoer,", "lheore's "iB, Vas 
Blom "Ebina above's "thig', Tin8s "| 


在 困 数 numwords ( ) 中 ， 人 例如 '1line.' 中 的 名 
上 太 。 我 们 最 好 先 去 挥 标点 符号 ， 然 后 再 把 内 容 拆 分 成 单词 。 这 样 做 是 下 一 个 练习 题 的 目标 。 


编写 函数 words ( ) ， 带 一 个 文件 名 作为 输入 参数 ， 返 回 文 件 中 的 真正 单 
疝 《 除 去 标 总 符 瑟 1 as 35 2 到 表 a 
>>> words('example.txt') 
上 
市 
a th "| 
有 时 需要 逐 行 处 理 文本 文件 。 例 如 ， 在 Web 服务 器 日 志文 件 中 搜索 包含 可 疑 IP 地 址 的 
记录 。 日 志文 件 是 一 个 文件 ， 其 中 每 一 行 都 是 某 个 事务 的 记录 (例如 ，Web 服务 器 对 Web 
页 面 请 求 的 处 理 )。 在 这 第 三 种 模式 中 ，readlines() 函数 用 来 读 取 文 件 的 内 容 作 为 一 个 
行文 本 的 列表 。 我 们 通过 一 个 简单 的 例子 说 明 这 种 模式 : 通过 返回 行文 本 的 长 度 的 方式 计算 
一 个 文件 中 的 行 数 。 它 还 将 打印 文本 行 的 列表 ， 以 便 我 们 观察 列表 的 内 容 。 


模块 : ch4.py 


def numLines(filename) : 
' 瓜 回 文件 filename 中 的 行 数 ， 
infile = open(filename，'rz')  # 打开 文件 
lineList = infile.readlines() # 读 取 文件 内 容 到 文本 行列 表 
infile.close() 


print (lineList) # 打印 行列 表 
return len(lineList) 


在 example.txt 上 运行 该 程序 。 注 意 每 行内 容 都 包含 换行 符 (\n): 


>>> numLines('example .txt') 


['The 3 lines in this file end with the new line character.\n', 
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'\n', 'There is a blank line above this line.\n'] 


3 

到 目前 为 止 ， 我 们 涉及 的 文件 处 理 模式 都 是 读 取 整个 文件 内 容 作 为 字符 串 或 字符 串 ( 行 ) 
列表 。 如 果 文 件 不 太 大 ， 这 种 方法 是 可 行 的 。 如 果 文 件 很 大 ， 则 更 好 的 方法 是 逐 行 处 理 文 
件 ， 这 样 就 避免 了 把 整个 文件 保存 在 内 存 中 。Python 支持 对 文件 对 象 行 的 迭代 。 我 们 使 用 这 
种 方法 打印 example.txt 的 每 一 行 : 


>>> infile = open('example .txt') 
>>> 于 GO line in infile: 
print (line,end='') 


The 3 lines in this file end with the new line character. 


There is a blank line above this line. 

在 for 循环 的 每 一 次 迭代 中 ， 变 量 Line 将 引用 文件 的 下 一 行 。 在 第 一 次 迭代 中 ， 变 
量 line 指 问 的 行 是 'The three lines in ...'; 在 第 二 次 迭代 中 ， 变量 Line 行 指向 
的 行 是 '\n' ; 在 最 后 一 次 迭代 中 ， 它 指 的 行 是 'There is a blank ..。'。 因 此 , 在 
任何 时 间 点 ， 只 有 一 行文 件 需 要 保存 在 内 存 中 。 


和 实现 函数 myGrep()， 这 2 个 输入 参数 : 文件 名 和 目标 字符 串 ， 输 出 文 
件 中 所 有 包含 目标 字符 串 作为 子 串 的 行 。 


>>> myGrep('example.txt', 'line') 
The 3 lines in this file end with the new line character. 
There is a blank line above this line. 


4.3.4” 写 入 文本 文件 
为 了 向 文本 文件 中 写 和 内容， 文件 必须 以 写 入 方式 打开 : 
>>> outfile = open('test.txt', ‘'w') 


如 果 在 当前 工作 目录 中 ,不 存在 文件 test .txt， 则 open() 函数 将 创建 该 文件 。 如 
条 文件 test .txt 已 经 存在 ， 则 清空 其 内 容 。 两 种 情况 下 ， 游 标 都 会 指向 〈( 空 ) 文件 的 开 
头 。〈 如 采 我 们 和 布 望 向 既 存 文件 中 添加 更 多 内 容 ， 则 需要 使 用 打开 模式 'a' 替代 'w'。) 

一 旦 以 写 人 方式 打开 了 文件 ， 则 可 以 使 用 果 数 write() 写 入 字符 串 到 文件 。 它 将 从 游 
标 位 置 开 始 写 入 字符 串 。 让 我 们 先 写 和 一 个 单字 符 字 符 串 : 


S53 Ottile.. writot'T") 


1 
返回 值 是 写 和 人 到 文件 的 字符 个 数 。 游 标 现在 指 问 字 符 T 后 面 的 位 置 ， 下 一 次 写 入 将 从 此 位 置 
开始 。 

>>> outfile.write('his is the first line.') 

22 


这 次 写 人 将 在 文件 的 第 一 行 的 字符 了 之 后 写 人 22 个 字符 。 现 在 游标 将 指向 句点 后 面 的 
位 置 。 


> DT We StiTTI the tirest Yine. ..\n’) 
25 
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直到 换行 符 之 前 写 和 的 所 有 内 容 都 将 写 和 人 到 同一 行 之 中 。 当 写 入 '\n' 之 后 ， 下 一 次 写 
人 将 写 人 第 二 行 : 


>>> outfile.write('Now we are in the second line.\n') 
S41 


转 义 字符 \n 表示 我 们 结束 了 第 二 行 ， 接 下 来 写 和 人 到 第 三 行 。 要 写 入 字符 串 以 外 的 其 他 
内 容 ， 必 须 先 转换 为 字符 串 : 
>>> outfile.write('Non string value like '+str(5)+' must be 


converted first.\n') 


49 


此 时 可 以 借助 于 字符 串 的 format ( ) 艺 数 。 为 了 说 明 使 用 字符 串 格 式 化 的 优越 性 ， 下 面 使 
用 字符 串 格式 化 输出 前 面相 同 的 行内 容 : 
>>> outfile.write('Non string value like {} must be converted 


f14r8t .. Va" :fornmat( 5)) 
49 


在 读 取 文本 文件 之 前 ， 必 须 在 写 人 之 后 先 关 闭 文 件 : 
>>> outfile.close() 


test .txt 文件 将 被 保存 在 当前 工作 目录 中 ， 且 其 内 容 如 下 : 


ee. 

2 Now we are in the second line. 

3 Non string value like 5 must be converted first. 
4 Non String Value like 5 must be converted first. 


注意 事项 : 刷新 输出 

当 一 个 文件 被 打开 用 于 写 入 时 ， 内 存 中 会 创建 一 个 缓冲 区 。 对 文件 的 所 有 写 入 实际 上 
都 是 写 入 这 个 缓冲 区 ， 并 没有 写 入 到 磁盘 ， 至 少 不 是 立即 写 入 。 

不 直接 写 入 诸如 磁盘 之 类 的 辅助 存储 器 的 原因 在 于 ， 这 种 写 入 需要 很 长 时 间 ， 如 果 每 
次 写 入 都 要 在 辅助 存储 器 上 进行 ， 那 么 进行 多 次 写 入 的 程序 将 非常 缓慢 。 这 意味 着 在 文件 
和 写 入 刷新 之 前 ， 文 件 系统 中 没有 创建 文件 。close() 函数 将 在 关闭 文件 之 前 ， 刷 新 缓 
冲 区 的 内 容 到 磁盘 文件 ， 所 以 一 定 不 要 忘记 关闭 文件 。 也 可 以 使 用 flush() 函数 刷新 写 
入 内 容 而 不 用 关闭 文件 : 


>>> outfile.flush() 


4.4 ”错误 和 异常 


我 们 通常 尝试 编写 不 产生 错误 的 程序 ， 但 不 侠 的 事实 是 ， 即 使 是 最 有 经 验 的 开发 人 员 编 
写 的 程序 有 时 也 会 朋 溃 。 而 且 ， 即 使 程序 是 完美 的 ， 它 仍然 可 能 产生 错误 ， 因 为 来 自 程 序 外 
的 数据 (从 用 户 或 文件 交互 ) 错误 将 会 导致 程序 中 的 错误 。 对 于 服务 顺 程 序 ( 如 网 络 、 邮 件 、 
洲 戏 服务 器 )， 这 是 一 个 大 问题 。 我 们 绝对 不 而 望 一 个 不 好 的 用 户 请 求 造 成 服务 器 毅 溃 的 错 
误 。 接 下 来 ,我 们 将 讨论 程序 执行 前 和 执行 期 间 可 能 出 现 的 一 些 错误 类 型 。 


4.4.1 语法 错误 


运行 Python 程序 时 ， 可 能 会 出 现 两 种 基本 错误 类 型 。 语 法 错误 是 由 于 Python 语句 格式 
不 正确 造成 的 错误 。 这 些 错误 发 生 在 语句 或 程序 被 转换 为 机 需 语 言 之 时 ， 在 程序 执行 之 前 。 
一 种 被 称 为 解析 器 的 Python 解释 器 的 组 件 负 责 发 现 这 些 错误 。 例 如 ， 对 于 以 下 表达 式 : 

>>> (3+4] 


SyntaxError: invalid syntax 


是 非法 表达 式 ， 解析 各 无 法 处 理 。 更 多 的 例子 如 下 : 


>>> if XxX == 

SyntaxError: invalid syntax 

>>> print 'hello' 

SyntaxError: invalid syntax 

>>> lst = [4;5;6] 

SyntaxError: invalid syntax 

>>> for i in range(10) : 

print (i) 

SyntaxError: expected an indented block 


在 每 个 语句 中 ， 错 误 都 是 由 于 Python 语句 的 语法 (格式 ) 错误。 所 以 这 些 错误 发 生 在 
Python 在 给 定 参 数 (如 果 有 的 话 ) 上 执行 语句 之 前 。 


解释 导致 上 述 每 个 语句 中 的 语法 错误 的 原因 ， 并 写 出 每 个 Python 语句 
全 吕 下 痪 下 


4.4.2 内置 异常 


现在 我 们 重点 关注 语句 或 程序 执行 过 程 中 发 生 的 错误 。 它 们 不 会 因为 os 语句 或 程 
序 的 错误 而 出 现 ， 而 是 因为 程序 执行 进入 了 错误 的 状态 。 下 面 给 出 了 一 些 示例 。 注 意 ， 在 每 
种 情况 下 ， 语 法 ( 即 Python 语句 的 格式 ) 是 正确 的 。 

被 0 除 导 致 的 错误 : 


>>> 4 OO 
Traceback (most recent call last) : 
File "<pyshell#52>", line 1, in <module> 
4/0 
ZeroDivisionError: division by zero 


由 于 错误 的 索引 导致 的 错误 


>>2 Jet = [14, 15, 16] 
>>> lst[3] 
Traceback (most recent call last): 
File "<pyshell#84>", line 1, in <module> 


lat[d 
lIndexError: list index out of range 
访问 未 赋值 变量 导致 的 错误 : 
-> 
Traceback (most recent call last): 
File "<pyshell#53>", line 1, in <module> 
党 示 看 


NameError: name 'x' is not defined 
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由 于 不 正确 的 操作 数 类 型 导致 的 铬 误 : 
SS 1028 可 13 
Traceback (most recent call last): 
File "<pyshell#54>", line 1, in <module> 
1 
TypeError: cant multiply sequence by non-int of type ‘str' 


由 于 非法 值 导致 的 错误 : 


5 
Traceback (most recent call last) : 
File "<pyshell#80>", line 1, in <module> 
int ("4.5') 


ValueError: invalid literal for int() with base 10: ' 

在 每 种 情况 下 ， 都 会 出 现 一 个 错误 ， 因 为 语句 执行 进入 无 效 状态 。 际 以 0 是 无 效 的 ， 
使 用 给 定 列表 中 有 效 索 引 范 围 之 外 的 列表 索引 也 是 无 效 的 。 当 发 生 这 种 情况 时 ， 我 们 说 
Python 解释 器 引发 了 一 个 异常 。 这 意味 着 一 个 对 象 被 创建 了 ， 这 个 对 象 包 含 了 所 有 与 错误 
相关 的 信息 。 例 如 ， 它 将 包含 错误 信息 ， 指 出 发 生 了 什么 ， 错 误 发 生 在 程序 (模块 ) 的 第 
几 行 (在 前 面 的 示例 中 , 行 号 总 是 1， 因 为 在 一 个 交互 式 命令 行 语句 “程序 ”中 只 有 一 个 语 
句 )。 当 出 现 错误 时 ， 默认 情况 下 是 语句 或 程序 月 沉 ， 并 输出 错误 信息 。 

错误 发 生 时 创建 的 对 象 称 为 异 第 。 每 个 异 第 都 有 一 个 类 型 (和 int 或 1ist 类 似 的 
类 型 )， 与 错误 类 型 关联 。 在 最 后 一 个 例子 ， 我 们 观察 到 这 些 异 第 类 型 分 别 为 : Zero- 
DivisionError 、IndexError 、NameError 、TYypeError 和 ValueError。 表 4-6 搞 
述 了 这 些 以 及 其 他 一 些 和 常见 错误 。 

表 4-6 常用 异常 类 型 。 当 程序 执行 过 程 中 发 生 了 一 个 错误 时 ， 会 创建 一 个 异常 对 象 。 异 常 

对 象 的 类 型 与 发 生 的 错误 类 型 有 关 。 这 里 仅仅 列举 了 少数 内 置 异常 类 型 


异 常 解释 说 明 
KeyboardInterrupt 当 用 户 按 快捷 键 【 Ctrl+C 】 时 抛 出 
OverflowError 当 一 个 浮 点 表达 式 求 值 结果 太 大 时 抛 出 
ZeroDivisionError 试图 除 0 时 抛 出 

IOError 当 一 个 IO 操作 由 于 输入 输出 故障 失败 时 抛 出 
IndexError 当 一 个 系列 索引 值 超出 有 效 索 引 范 围 时 抛 出 
NameError 试图 求 值 一 个 未 赋值 的 标识 符 (名 称 ) 时 抛 出 
TypeError 当 一 个 操作 或 靖 数 应 用 于 错误 类 型 的 对 象 时 抛 出 
ValueError 当 一 个 操作 或 隐 数 的 操作 类 型 正确 但 值 不 正确 时 抛 出 


让 我 们 再 看 几 个 有 关 异 常 的 例子 。 当 一 个 浮 点 表达 式 的 求 值 结果 超出 使 用 浮 点 类 型 可 以 
表示 的 值 范 围 之 外 时 ， 将 抛 出 overflowError 对 象 。 在 第 3 章 中 ， 我 们 讨论 过 如 下 例子 : 


>>> 2.0**10000 
Traceback (most recent call last): 


File "<pyshell#92>", line 1, in <module> 
2.0**10000 
QverflowError: (34, 'Result too large') 


有 趣 的 是 ， 对 整数 表达 式 求 值 时 不 会 抛 出 洲 出 腊 第 : 


>>> 2**10000 
199506311688075838488374216268358508382349683188619245485200894985 


。# manv more lines of numbers 


0455803416826949787141316063210686391511681774304792596709376 
(请 读者 回顾 学 过 的 知识 ， 类 型 int 的 值 本 质 是 没有 上 限 的 。) 

KeyboardInterrupt 异 稼 某 种 程度 上 有 别 于 其 他 异 帝 ， 这 是 因为 该 异 背 由 程序 用 
户 交 互 式 地 显 式 引发 。 在 执行 程序 过 程 中 ， 通 过 按 快 捷 键 【 Ctrl+C 】]， 用 户 可 以 中 断 程序 
运行 。 这 将 导致 程序 进入 一 种 错误 的 中 断 状 态 。Python 解释 器 抛 出 的 异常 是 Keyboard- 
Interrupt 类 型 。 一 般 用 户 通过 按 快捷 键 【 Ctrl+C 】 来 中 断 程序 运行 (例如 ， 当 程序 运行 
时 间 过 长 ): 

>>> for i in range(2**100): 

pass 

Python 语句 pass 不 执行 任何 (实际) 操作 ! 常用 于 需要 代码 (例如 一 个 for 循环 语句 
的 循环 体 ) 但 不 执行 任何 操作 的 地 方 。 通 过 按 快捷 键 【 Ctrl+C ])， 可 以 中 断 程 序 运 行 ， 产生 
KeyboardInterrupt 错误 信息 : 

>>> for i in range(2**100): 


pass 


KeyboardIlnterrupt 


当 输 入 和 输出 操作 失败 时 ， 将 抛 出 IOError 异常 。 例 如 ， 如 果 尝 试 打 开 一 个 文件 用 于 
读 取 ， 但 给 定 文件 名 的 文件 并 不 存在 : 


>>> infile = open('exaple.txt') 
Traceback (most recent call last) : 
File "<pyshell#55>", line 1, in <module> 
infile = open('exaple .txt') 
IOError: [Errno 2] No such file or directory: 'exaple.txt' 


当 用 户 尝试 打开 没有 访问 权限 的 文件 时 ， 也 会 抛 出 Togrror 异常 。 


4.5 电子 教程 案例 研究 : 图 像 文 件 


本 章 的 重点 是 文本 处 理 和 使 用 Python 读 取 和 写 人 文本 文件 。 在 案例 研究 CS 4 中 ,我 们 
将 讨论 使 用 Python 读 取 和 写 人 图 像 文 件 (通常 存储 为 二 进 制 文件 而 不 是 文本 文件 ) 以 及 处 
理 图 像 的 方法 。 我 们 也 借 此 机 会 展示 如 何 安装 没有 包括 在 Python 标准 库 但 在 Python 包 索 引 
(PyPI， 官 方 的 第 三 方 Python 软件 库 ) 中 列 出 的 Python 模块 。 


4.6 ”本 章 小 结 


本 章 介 绍 了 Python 文本 处 理 和 文件 处 理工 具 。 

我 们 继续 讨论 第 2 章 介 绍 的 字符 串 str 类 ， 描 述 了 定义 字符 串 值 的 不 同方 法 : 使 用 单 
引号 、 双 引号 、 三 引号 。 我 们 描述 了 在 字符 串 中 如 何 使 用 转移 字符 序列 来 定义 特殊 字符 。 最 
后 ， 我 们 介绍 了 类 str 支持 的 方法 ， 因 为 第 二 章 中 仅仅 讨论 了 字符 串 运算 符 。 

我 们 重点 讨论 的 一 个 字符 串 方法 是 format ( ) ， 用 于 控制 字符 串 格 式 。 格 式 化 字符 串 可 
以 通过 print() 因数 输出 。 我 们 解释 了 描述 输出 格式 的 格式 化 字符 串 的 语法 格式 。 掌握 了 
字符 串 格 式 化 输出 之 后 ， 读 者 可 以 更 加 专注 于 程序 的 复杂 部 分 ， 而 不 用 担心 输出 格式 。 我 们 
还 介绍 了 一 个 重要 的 标准 库 模块 二 ime， 该 模块 提供 获取 时 间 的 图 数 ， 以 及 按期 望 格式 输出 
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时 间 的 格式 化 函数 。 


本 章 还 介绍 了 文件 处 理工 具 。 首 先 我 们 解释 了 文件 和 文件 系统 的 概念 。 然 后 介绍 了 打开 


文件 的 方法 open( ) 、 关 闭 文件 的 方法 close( ) 、 读 取 文 件 的 方法 read( ) 、 写 人 字符 串 
到 文件 的 方法 write()。 根 据 文件 处 理 的 方式 不 同 ， 我 们 描述 了 读 取 文件 的 几 种 不 同 模式 。 


在 前 几 章 中 非 正式 地 讨论 了 编程 错误 。 由 于 在 处 理 文 件 时 出 错 的 可 能 性 较 高 ， 我 们 正式 


讨论 错误 的 概念 ， 并 定义 了 异常 。 我 们 列 出 了 学 生 可 能 会 遇 到 的 各 种 不 同类 型 的 异常 。 
4.7 练习 题 答案 


4.1 


4.2 


4.3 


4.4 


4.5 


4.0 


4.7 


4.8 


表达 式 为 : 

(a) BT255] 《by srT7s93], (Ce) BI1s9]: (d) ELST and (e) st7s] tor at-3s]) 
方法 调用 为 : 

(a) count = forecast.count('day') 

(b) weather = forecast.find('sunny') 

(c) change = forecast.replace('sunny', 'cloudy') 

使 用 制 表 符 作 为 分 隅 符 。 


>>> print(last, first, middle, sep='\t') 


使 用 函数 range() 迭代 从 2 到 宗 的 整数 ， 测 试 每 个 整数 ， 如 果 能 被 2 或 3 整除 ， 则 使 用 参数 


end 三 上， 输出 。 


def even (Cn) 
for i in range(2, n+1): 
if i%2 == 0 or ip3 == 0: 
print (i, end=', ') 


我 们 只 需要 在 合适 的 位 置 放置 一 个 逗号 和 两 个 换行 符 : 


> ftring = "t+ CBAF LENnAF, A LY 
>>> print(fstring.format (first,last,number,street,city,state,zipcode)) 


答案 使 用 浮 点 数 表示 类 型 £: 


def roster(students): 
'prints average grade for a roster of students' 
print('Last First Class Average Grade') 
for student in Students : 
print('{:10}{:10}{:10}{:8.2f}'.format (student [0] ， 
student [1] ，student [2] ，student [3] ) ) 


格式 化 字符 串 如 下 所 示 : 

(a) time.strftime('%A, %B %d %Y,'", t) 

(b) time.strftime('%I:%M %p %Z Central Daylight Time on %m/%d/%Y',t) 

(c) time.strftime('l will meet you on %a %B %d at %I:%M %p., t) 

首先 读 取 文件 内 容 到 一 个 字符 串 ， 然 后 使 用 字符 串 也 数 来 统计 子 字 符 串 target 出 现 的 次 数 。 


def stringCount (filename, target).: 
' 返回 target 在 文件 filename 中 出 现 的 次 数 ， 
infile = open(filename) 
content = infile.read() 
infile.close() 
return content.count(target) 
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4.9 ”为 了 移 除 文本 中 的 标点 符号 ， 可 以 使 用 字符 串 translate( ) 方法 ,把 每 一 个 标点 符号 字符 替换 
成 一 个 空 字符 串 
def words (filename) : 
返回 文件 filename 中 的 单词 列表 ， 
infile = open(filename, 'r') 
content = infile.read() 
infile.close() 
table = str.maketrans('!,.::;?', 6*' ') 
content=content .translate(table) 
content=content .lower() 
return content.split() 


4.10 ”迭代 文件 的 各 行 可 以 完成 任务 : 
def myGrep (filename，target) : 
' 输出 文件 Lename 中 包含 字符 串 七 arget 的 行 ， 
infile = open(filename) 
for line in infile: 
if target in line: 
print (line, end='') 


4.11 语法 错误 的 原因 和 正确 的 语句 分 别 如 下 : 

(1 ) 左边 的 圆 括号 与 右边 的 方 括号 不 匹配 。 期 望 的 表达 式 可 能 是 (3+4) ( 求 值 结果 为 整数 7 )， 
或 者 是 [3+4] ( 求 值 结果 为 包含 整数 7 的 列表 ) 。 

(2 ) 遗漏 了 骨 号 。 正 确 的 表达 式 是 “ift x == 5:”。 

(3) Drzintt() 是 一 个 函数 ， 因此 其 调用 需要 使 用 括号 号 ， 并 在 括号 中 指定 参数 (如 果 带 参数 )。 
正确 的 表达 式 是 print('hello' ). 

(4) 列表 中 的 对 象 使 用 逗号 分 隅 ， 所 以 “lst=[4,5,6] ”是 正确 的 表达 式 。 

(5 ) for 循环 语句 的 循环 体 中 的 语句 必须 缩 进 


>>> for i in range(3) : 


print (i) 
4.8 习题 
4.12 ”首先 在 交互 式 命令 行 中 运行 下 列 赋 值 语句 : 
>>> Ss = 'abcdefghijklmnopqdrs 


然后 ， 使 用 字符 串 s 和 索引 运算 符 编 写 表 达 式 ， 要 求 表达 式 的 求 值 结果 分 别 为 "bcd' .ab 
c'、'defghijklmnopqrstuvwx' 、'wxy' 和 'wxy2z' 


4.13 首先 定义 字符 串 s: 
S8= 3abcdaetghl]jxlmnnopqrstuVwXYZ， 


然后 ， 根 据 下 列 假设 ， 编 写 Python 布尔 表达 式 : 
(a) 包括 s 的 第 二 个 和 第 三 个 字符 的 切片 是 'bc， 
(b) 包括 s 的 前 14 个 字符 的 切片 是 ， eh 
(c) 不 包括 s 的 前 14 个 字符 的 切片 是 'opqrstuvwxyz'。 
(d) 不 包括 s 的 第 一 个 和 最 后 一 个 字符 的 切片 是 'bcdefghijklmnopqrstuvw'。 
4.14 把 下 列 叙 述 翻 详 成 一 个 Python 语句 : 
(a) 把 变量 log 赋值 为 如 下 字符 串 〈 该 字符 串 是 一 个 Web 服务 器 上 请 求 一 个 文本 文件 的 日 志 的 
片段 ): 


4.13 


4.18 


4.19 
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128.0.0.1 - - [12/Feb/2011:10:31:08 -0600] "GET /docs/test.txt HTTP/1.0" 

(b) 把 变量 address 赋值 为 1og 的 子 字符 串 : 到 1og 的 第 一 个 空格 前 结束 。 请 使 用 字符 串 方 
法 sp1it() 和 索引 运算 符 。 

(c) 把 变量 date 赋值 为 字符 串 1og 的 切片 ， 包 含 日 期 (12/Feb ...-6000)。 在 字符 串 1og 
上 使 用 索引 运算 符 。 

对 于 下 列 每 一 个 s 的 字符 串 值 ， 编 写 使 用 字符 串 s 和 字符 串 方法 split() 的 表达 式 ， 要 求 表 

达 式 的 求 值 结果 为 如 下 列表 : 


hr; I IANT ee | 1 RANT '601!] 
[10 a0 “0, +40 s B00" “©Q 


(a) Ss = "10 20 30 40 50. 0" 

(0b) 8 = "10;20,30,40,50.60" 

(县 '10&20&30&40&50&60' 

(d)s='10-20-30-40-50- 60' 

实现 一 个 程序 ， 请 求 用 户 输入 三 个 单词 (字符 串 )。 如 果 输 入 的 三 个 单词 按 字 典 序 排列 ， 则 输出 
布尔 值 True; 和 否则， 什么 也 不 输出 ， 

SS 

Enter first word: bass 

Enter second word: salmon 


Enter third word: whitefish 
True 


使 用 合适 的 字符 串 方法 ， 把 下 列 叙 述 翻译 成 一 个 Python 语句 : 

(a) 把 变量 message 赋值 为 字符 串 : 'The secret of this message is that it is 
SecLIetL 

(b) 使 用 运算 符 1en( ) ， 把 变量 length 赋值 为 字符 串 message 的 长 度 。 

(c) 使 用 字符 串 方 法 count( ) ， 把 变量 count 赋值 为 子 字符 串 'secret ' 在 字符 串 message 
中 出 现 的 次 数 。 

(d) 使 用 字符 串 方 法 replace( ) ， 把 变量 censored 赋值 为 字符 串 message 的 一 个 副本 : 字 
符 串 中 所 有 的 子 字 符 串 ' secret' 都 被 替换 为 ' xxxxxx'。 

假设 变量 s 按 如 下 方式 赋值 : 


S= "" "1t was the best of times, it WaS the worst of times:; it 


was the age of wisdom, it was the age of foolishness; it Was the 


epoch of belief, it was the epoch of incredulity; it was 


(查尔斯 .狄更斯 的 小 说 《双城记 》 的 开头 部 分 。) 然后 依次 完成 : 
(a) 编写 一 系列 语句 ， 生 成 s 的 一 个 名 为 news 的 副本 : 其 中 字符 .、, 、; 和 \n 都 被 替换 成 


(b) 移 除 news 的 开始 和 结尾 空格 (并 把 新 字符 串 命名 为 newS )。 

(c) 把 news 的 所 有 字符 转变 为 小 写字 母 (并 把 新 字符 串 命名 为 newS )。 
(d) 计算 字符 串 'it was' 在 news 中 出 现 的 次 数 。 

(e) 把 所 有 的 was 替换 成 is (并 把 新 字符 串 命名 为 newS ) 。 

(f) 把 news 拆 分 为 一 个 单词 列表 并 命名 为 lists。 
假设 已 经 分 别 为 变量 fizst、middle 和 1ast 赋值 : 

>3> ff1n8t = Marlenma! 

>>> last = 'Sigel' 

>>> middle = 'Mae, 
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4.20 


4.21 


4.9 


4.22 


4.23 


4.24 


4.25 


4.26 
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编写 Python 语句 ， 使 用 以 上 变量 打印 下 列 格式 的 输出 : 

(a) Sigel, Marlena Mae 

(b) Sigel, Marlena ML 

(c) Marlena M. Sigel 

(d) M. M. Sigel 

(e) Sigel, M. 

给 定 电 子 邮 件 的 sender、recipient 和 subject 的 字符 串 值 ， 编 写 一 个 字符 串 格 式 化 表达 
式 ， 使 用 变量 sender、recipient 和 subject， 输 出 如 下 格式 的 内 容 : 


>>> sender = 'tim@abc.com' 

>>> recipient = 'tom@xyz.org ' 

>>> subject = 'Hello!' 

>>> print(???) # fill in 
From: tim@abc.com 

To: tom@xyz.org 

Subject: Hello! 


编写 Python 语句 ， 按 下 列 格 式 输出 xz 和 欧 拉 常数 e 的 值 : 
(a) pi=3.1,e=2.7 

(b) pi=3.14,e=2.72 

(c) pi= 3.141593e+00, e = 2.718282e+00 

(d) pi= 3.14159, e = 2.71828 


思考 题 


编写 函数 month ( ) ， 带 一 个 输入 参数 : 1 到 12 之 间 的 数值 ， 返 回 对 应 月 份 的 3 个 字母 缩写 形 
式 。 要 求 不 能 使 用 if 语句 ， 只 允许 使 用 字符 串 操 作 。 提 示 : 使 用 一 个 字符 串 ， 按 顺序 保存 月 份 
的 缩写 。 


>>> month(1) 


A 

>>> month (11) 

'Nov' 

编写 一 个 消 数 average( ) ， 不 惠 任 何 参数 ， 但 提示 用 户 输入 一 个 句子 。 上 因数 返回 句子 中 单词 的 
平均 长 度 。 


>>> average() 
Enter a Sentence: A sample sentence 
5.0 


编写 图 数 cheer ( ) ， 囊 一 个 输入 参数 : 团队 名 (字符 串 )， 输 出 如 下 所 示 的 加 油 口号 : 


>>> cheer('Huskies') 

How do you spell winner? 

I know, I know! 

:和 

And that's how you spell winner! 
Go Huskies! 


编写 限 数 vowelcount ( ) ， 带 一 个 字符 串 作 为 输入 参数 ， 统 计 并 输出 字符 串 中 元 音 出 现 的 次 数 : 


>>> vowelCount('Le Tour de France') 
a, e@, i, 0, and u appear, respectively, i, 3, 0, 1, 1 times. 


加 密 消 数 crypto( ) 带 一 个 字符 串 作为 输入 参数 ( 即 当 前 目录 中 的 一 个 文件 的 文件 名 )。 子 数 在 
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4.27 


4.28 


4.29 


4.30 


4.32 


屏幕 上 输出 文件 ， 并 作 如 下 修改 : 文件 中 的 所 有 字符 ' secret' 替代 为 'xxxxxx'。 


> eryptol "crypto tt ') 
I will tell you my xxxxxx. But first, I have to explain 
why it is a XXXXXX。 


And that is all I will tell you about my XXXXXX . 


编写 一 个 冰 数 fcopy( )， 市 两 个 文件 名 (字符 串 ) 作为 输入 参数 ， 把 第 一 个 文件 的 内 容 拷贝 到 
第 一 个 文件 中 

>>> fcopy('example.txt','output.txt') 

>>> open('output .txt').read() 


'The 3 lines in this fie end with the ne line character ,. \n\n 


There is a blank line above this line.\n' 


编写 函数 1inks ( ) ， 带 一 个 输入 参数 : 一 个 HTML 文件 (字符 串 )， 返 回 该 文件 中 超 链 接 的 个 数 。 
假定 每 个 超 链接 出 现在 一 个 锚 点 标签 中 (<a> 开始 )， 且 每 个 锚 点 标签 以 子 字 符 串 </a> 结束 。 

可 以 使 用 HTML 文件 twolinks .html 或 者 任何 从 Web 上 下 载 到 程序 所 在 目录 的 HTML 
文件 来 测试 编写 的 代码 。 
>>> links('twolinks.html') 
2 


编 与 一 个 胃 数 stats ( )， 市 一 个 输入 参数 : 一 个 文本 文件 的 文件 名 。 要 求 函 数 在 屏幕 上 输出 该 
文件 的 行 数 、 单 词 个 数 、 字 符 个 数 。 要 求 函数 仅 打开 文件 一 次 。 


>>> stats('example.txt') 
line count: 3 

word Count 20 
character. count: '98 


编写 函数 distribution()， 带 一 个 输入 参数 : 一 个 文件 的 文件 名 (字符 串 )。 该 单行 文件 中 
包含 空格 分 隔 的 成 绩 的 等 级 字母 。 要 求 函 数 输出 成 绩 的 分 布 ， 如 下 所 示 : 


>>> distribution('grades .txt') 
students got A 
students got A- 
students got B+ 
students got B 
students got B- 
students got C 
student got C- 
students got F 


实现 消 数 auplicate()， 市 一 个 输入 参数 : 当前 目录 中 一 个 文件 的 文件 名 (字符 串 )。 如 果 文 
件 包含 重复 的 单词 ， 则 返回 True， 否 则 返回 False。 

>>> duplicate('Duplicates.txt') 

True 

>>> duplicate('noDuplicates.txt') 

False 

阴 数 censor ( ) 带 一 个 输入 参数 : 一 个 文件 的 文件 名 (字符 串 )。 要 求 函数 打开 该 文件 ， 读 取 
文件 内 容 ， 按 下 列 要 求 修改 并 写 人 到 文件 censored .txt : 文件 中 所 有 的 4 个 字母 的 单词 替换 


为 :XXXX ' : 


OD 让 DO 


>>> censor('example.txt') 


注意 : 这 个 函数 没有 任何 输出 ,但 会 在 当前 目录 中 创建 文件 censored .txt。 
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执行 控制 结构 





本 音 深 入 讨论 Python 语句 以 及 控制 什么 时 候 执行 什么 语句 块 和 执行 多 少 次 的 方法 。 

我 们 首先 讨论 Python 语言 的 选择 控制 结构 :if 语句。 第 3 章 介绍 了 if 语句 的 单 分 文 
和 双 分 支 格式 。 本 章 将 介绍 其 一 般 格式 : 多 重 选 择 控 制 结 构 ， 允 许 任意 数量 的 条 件 并 定义 相 
关 的 代码 块 。 

接 下 来 将 深入 讨论 Python 迭代 控制 结构 和 方法 。 两 种 Python 语句 提供 重复 执行 代码 块 
的 能 力 : for 循环 和 while 循环。 两 种 循环 都 有 广泛 的 用 途 。 本 和 曹 的 大 部 分 小 节 将 讨论 不 
同 的 迭代 模式 ， 什 么 时 候 使 用 以 及 如 何 使 用 这 些 迭 代 模 式 。 

理解 不 同 的 迭代 模式 实际 上 是 理解 不 同 的 分 解 问题 并 迭代 解决 它们 的 方法 。 因 此 ， 本 章 
从 根本 上 来 说 是 关于 问题 解决 方法 的 讨论 。 


5.1 选择 控制 和 if 语句 


if 语句 是 基本 的 选择 控制 结构 ， 它 允许 基于 某 些 条 件 执行 相应 的 选择 代码 块 。 在 第 
3 章 中 ， 我 们 介绍 了 Python 语言 的 iE 语 句 。 我 们 首先 讨论 了 它 的 最 简单 形式 ， 即 单 分 文 
格式 : 
if < 条 件 >: 
< 缩 进 代 码 块 > 
< 非 缩 进 语句 > 
当 < 条件 > 求 值 结果 为 True 时 ， 则 执行 < 缩 进 代码 块 >; 如 果 < 条件 > 求 值 结果 为 
False， 则 跳 过 缩 进 代码 块 ， 没 有 可 选择 执行 的 语句 块 。 无 论 哪 种 情况 ， 不 管 缩 进 代码 是 否 
被 执行 ， 将 继续 执行 紧 接着 下 面 的 与 if 语句 相同 缩 进 的 < 非 缩 进 语句 >。 
当 两 个 可 选 代 码 块 必须 根据 条 件 执行 时 ， 使 用 if 语句 的 双 分 文 格 式 : 
if < 条 件 >: 
< 缩 进 代码 块 1> 
else: 


< 缩 进 代码 块 2> 
< 非 缩 进 语句 > 


当 < 条 件 > 求 值 结果 为 True， 则 执行 < 缩 进 代 码 块 1 > ; 当 < 条 件 > 求 值 结 果 为 
False， 则 执行 < 缩 进 代 码 块 >。 注意 : 根据 条 件 执 行 的 两 个 代码 块 是 互 矿 的。 不管 哪 种 
情况 ， 程 序 继续 执行 < 非 缩 进 语句 >。 

5.1.1 三 路 以 及 多 路 分 支 ， 
Python 语言 的 if 语句 的 最 一 般 的 格式 是 多 路 (三 分 文 或 更 多 分 文 ) 的 选择 控制 结构 : 
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if < 条件 1>: 
< 缩 进 代码 块 1> 
elif < 条 件 2>: 
< 缩 进 代码 块 2> 
elif < 条 件 3>: 
< 缩 进 代码 块 3> 
else: # 还 可 以 有 更 多 的 elif 语句 
< 最 后 的 缩 进 代码 块 > 
< 非 缩 进 语句 > 


上 述 语 句 按 下 列 方法 执行 : 

e 如 果 < 条件 1> 为 True， 则 执行 < 缩 进 代码 块 1>; 

e 如 果 < 条 件 1> 为 False 但 是 < 条 件 2> 为 True， 则 执行 < 缩 进 代 码 块 2>; 

e 如 果 < 条 件 1>“ 和 < 条 件 2> 均 为 False 但 是 < 条 件 3> 为 True， 则 执行 < 缩 进 代 

码 块 3>; 

e 如 果 没 有 条 件 为 True， 则 执行 < 最 后 的 缩 进 代 人 码 块 >。 

在 任何 情况 下 ， 程 序 将 继续 执行 < 非 缩 进 语句 >。 

关键 字 elif 表示 “else if”。 一 个 elif 语句 后 跟 一 个 条 件 ， 这 与 if 语句 类 似 。if 
语句 后 可 跟 任 意 数 量 的 elif 语句 ， 最 后 还 可 以 跟 一 个 else 语句 (可 选 )。 每 个 if 语句 、 
elif 语句 以 及 可 选 的 else 语句 后 ， 都 关联 一 个 缩 进 代码 块 。Python 将 执行 第 一 个 求 值 结 
果 为 True 的 条 件 的 关联 缩 进 代码 块 。 如 果 没 有 条 件 求 值 结果 为 True， 且 存在 else 语句 ， 
则 执行 else 语句 后 的 缩 进 代码 块 。 

在 下 述 函 数 temperature() 中 ,我们 拓展 第 3 章 的 temperature 示例 ， 描 述 三 路 分 文 
if 语句 的 用 法 : 


模块 : ch5.py 


def temperature(t): 
”根据 温度 值 七 输出 不 同 信息 ， 


i 6 
print('Ii Ls het *) 
elif t » 2 
brint('It Ye Sodl.') 
~- else: 
print('It is freezing!') 


对 于 一 个 给 定 七 的 值 ， 第 一 个 满足 条 件 的 缩 进 语句 将 被 执行 ; 如 果 第 一 个 和 第 二 个 条 件 
都 不 满足 ， 则 else 场 句 相应 的 缩 进 霹 句 将 被 执行 。 


>>> temperature(87) 
It is hot! 

>>> temperature(86) 
lt 18 cool; 

>>> temperature(32) 
It is freezing! 


该 男 数 执行 流程 图 如 图 5-1 所 示 。 


[print('It is hot!') 


EY/ 








一 一 


Comp > 22>- en eh i 
2 
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print('It is freezing!') re It Les: ‘Goo. "| 
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图 5-1 困 数 temperature( ) 的 流程 图 。 首 先 检查 条 件 t > 86， 如 果 为 True， 则 执行 语 
和 句 print('It is hot!')。 如 果 为 False， 则 检查 条 件 t > 32， 如 果 为 True， 
则 执行 语句 print('It is cool!')。 如 果 为 False， 则 执行 语句 print('It 


is freezing!') 


5.1.2 条 件 的 排列 顺序 

多 路 分 支 结 构 存 在 一 个 单 分 支 或 双 分 支 if 语句 不 存在 的 问题 : 在 多 路 if 语句 中 条 件 
的 排列 顺序 十 分 重要 。 为 了 说 明 这 一 点 ， 请 读者 尝试 分 析 下 列 temperature() 困 数 实现 
中 条 件 的 排列 顺序 有 什么 错误 。 


def temperature(t): 


i bY a2 

prinb( "It Ts eool.') 
elif t > 86: 

Dei" is lott') 
else: 


print('It igs freezing!') 


该 实现 的 问题 在 于 : 对 于 所 有 七 大 于 或 等 于 32 间作 全， 都 将 输出 'It is cool.'。 因 此 ， 
妨 果 所 等 于 104， 结 果 输 出 7 Ecool.1。 事实 上 ， 不 管 七 的 值 多 大 ， 永远 都 不 会 办 
出 :It is Notl', 问题 的 根源 在 于 条 件 + > 32 和 七 > 86 并 不 是 互 斥 的 ， 而 双 分 支 结 
构 中 对 应 语句 块 的 条 件 则 是 互 斥 的 。 

修正 错误 实现 的 一 种 方法 是 显 式 保证 条 件 互 斥 : 


def temperature (七 ) : 


32 < 和 = # 增加 条 件 七 <= 86 
Bet ("It i COOL. ") 

elif tt > 806: 
Eint ("Tt is Wot 

else: # 韦 <= 2 


Deint (It is Breezingl! 1 


然而 ， 显 式 指 定 互 斥 条 件 会 让 程序 变 得 非常 复杂 腑 肿 。 另 一 种 修正 这 种 错误 实现 的 方法 
是 隐 式 保证 条 件 互 斥 ， 正 如 我 们 最 初 的 函数 temperature( ) 的 实现 方式 。 解 释 如 下 : 


temperature() 哨 数 包括 三 个 不 同 的 代码 片段 ， 每 个 对 应 于 一 个 特定 的 温度 范围 : 
1 > 86%F 、32°F< t <= 86°F 和 上 <= 32°F。 其 中 一 个 范围 必须 作为 三 路 分 支 ff 语句 的 第 一 个 
条 件 ， 例如: 七 > 86。 

在 三 路 分 支 if 语句 中 ， 仪 当 第 一 个 条 件 不 满足 时 ( 即 : t 的 值 不 大 于 86 )， 才 会 继续 
测试 后 续 条 件 。 因 此 ， 任何 后 续 条 件 隐 式 包括 tt <= 86。 所 以 ， 显 式 指定 的 第 二 个 条 件 实 
际 上 等 同 于 32 < 七 <=86。 同 样 地 ，else 语句 的 隐 式 条 件 是 上 <= 32， 因 为 仅 当 七 最 
多 为 32 时 才 会 被 执行 。 


i 编写 函数 myBMI()， 带 两 个 输入 参数 : 身高 (单位: 英寸 ) 和 体重 (单位 : 
磅 )， 计 算 人 体 体 重 指数 (BMI)。BMI 的 计算 公式 为 : 
. weight * 703 
i 

height 

要 求 函数 体 中 : 当 bmi < 18.5 时 ,输出 “体重 过 轻 ”; 当 18.5 <= bmi <25 时 ,输出 “ 正 
常 "; 当 bmi >= 25 时 ， 输 出 “体重 过 重 ”。 

>>> myBMI(190, 75) 

正常 

>>> myBMI (140, 75) 

体重 过 重 


5.2 ”for 循环 和 迭代 模式 
在 第 3 章 中 ， 我 们 介绍 了 for 循环 。 一 般 来 说 ，for 循环 具有 如 下 结构 : 


for < 变量 > in < 序列 >: 
< 缩 进 代码 块 > 
< 非 缩 进 语句 > 


变量 < 序列 > 必须 指 疝 一 个 可 迭代 的 对 象 ， 例 如 字符 串 、 列 表 、range、 或 其 他 可 迭代 
容器 类 型 ， 我 们 将 在 第 8 章 进 一 步 讨 论 。 当 Python 运行 for 循环 时 ， 依 次 把 < 序列 > 中 的 
值 赋值 给 < 变量 >， 并 针对 < 变量 > 的 每 一 个 值 执行 < 缩 进 代码 块 >。 针 对 < 序列 > 中 的 最 
后 一 个 值 执行 完 < 缩 进 代码 块 > 后 ， 程 序 继续 执行 for 循环 语句 后 的 < 非 缩 进 语句 >。< 非 
缩 进 语句 > 位 于 for 循环 语句 之 后 ， 且 与 for 循环 语句 的 第 一 行 代码 缩 进 相同 。 

for 循环 语句 以 及 一 般 循 环 结构 广泛 用 于 程序 设计 ， 并 且 存 在 许多 使 用 循环 的 方法 。 本 
芒 我 们 将 讨论 大 干 基本 的 循环 使 用 模式 。 


5.2.1 循环 模式 : 迭代 循环 
本 书 到 目前 为 止 ， 我 们 都 是 使 用 for 循环 迭代 一 个 列表 的 项 : 


23% = [ecat's "dog's en] 
>>> for animal in 1: 

print (animal) 
cat 


日 °F 为 华氏 温度 ， 与 摄氏 温度 的 换算 关系 为 : t. = 5 x (ti 一 32)/9。 


dog 

chicken 

当然 ， 还 可 以 使 用 for 循环 迭代 一 个 字符 串 的 字符 : 
>>> s = 'cupcake' 


> fOr © ly Ss. 
if ee ln aeiou'!s 
print(e) 


OO pp cc 


迭代 一 个 显 式 指定 的 序列 值 并 针对 每 个 值 执行 某 种 操作 ， 这 是 for 循环 的 最 简单 的 使 
用 模式 。 我 们 把 这 种 使 用 模式 称 为 迭代 循环 模式 。 这 种 循环 模式 是 本 书目 前 为 止 使 用 最 多 的 
模式 。 作 为 迭代 循环 模式 的 最 后 一 个 示例 ， 我 们 列 出 第 4 草 中 的 代码 : 逐 行 恋 取 文 件 的 文本 
行 并 在 交互 式 命令 行 中 输出 各 行内 容 : 

> Enfile =: open( 'test, txt's rr') 

>>> for lirne in intile: 

print (line, end="') 

在 上 例 中 ， 和 迭代 的 内 容 不 是 字符 串 的 字符 ， 也 不 是 列表 的 项 ， 而 是 文件 对 象 infile 

的 文本 行 。 虽 然 容 右 各 不 相同 ,但 基本 的 迭代 模式 保持 不 变 。 


5.2.2 ”循环 模式 : 计数 钴 循环 
我 们 可 以 使 用 的 另 一 个 循环 模式 是 迭代 通过 男 数 range( ) 指定 的 一 个 整数 序列 : 
3 for ETLOD) ; 
print (i, end=' ') 


6 


我 们 把 这 种 模式 称 为 计数 俘 循 环 模式 。 计 数 需 循环 模式 用 于 需要 针对 茶 个 整数 犯 围 的 每 
个 整数 执行 代码 块 的 情况 。 例 如 ， 查 找 (并 且 输 出 ) 从 0 到 整数 n 的 所 有 侦 数 : 
>2>> n = EO 
>>> for i in range(n): 
i 六 儿 == 9: 
print(i, end = ' ') 


U2468 





编写 一 个 名 为 powers( ) 的 函数 ， 带 一 个 正 整 数 严 作为 输入 参数 。 在 屏 
幕 上 输出 从 2 到 2 "的 所 有 2 的 乘 宕 。 

>>> powers(6) 

2 4 8 16 32 64 

迭代 一 个 连续 整数 序列 的 一 个 很 疝 见 的 原因 是 生成 序列 的 票 引 ， 不 管 序 列 是 一 个 列表 、 
字符 串 还 是 其 他 序列 。 下 面 使 用 一 个 新 的 宠物 列表 (pets ) 来 说 明 : 


33> pets = [icat1 "dvg's tish's bire’!] 


可 以 使 用 迭代 循环 模式 来 输出 列表 中 的 动物 : 


>>> for animal in pets: 
print (animal) 


cat 
dog 
fish 
bird 
作为 迭代 列表 pets 中 项 的 替代 方法 ， 还 可 以 通过 迭代 列表 pets 的 索引 来 获得 相同 的 
结果 : 
>>> for i in range(len(pets)): # 主 被 赋值 为 0、1、2、… 
print (pets [i]) # 打印 位 于 索引 工 处 的 对 象 


cat 

dog 

fish 

bird 

注意 闷 数 range( ) 和 国 数 len( ) 协同 工作 ， 生 成 列表 pets 的 索引 0、1、2 和 3。 循 
环 的 执行 描述 如 图 5-2 所 示 。 





pets 

二 vcat 

1 ' dog” 

二 ‘fish' | 

i=3 ‘pird' 


图 5-2” 计数 器 模式 。 在 for 循环 中 ,变量 i 依次 被 赋值 为 0、1、2 和 3。 对 于 每 一 个 值 i， 
输出 列表 对 象 pets[i] : 当 i 为 0 时 , 输出 'cat'， 当 二 为 1 时, 输出 'dog'， 以 
此 类 推 
第 二 种 方法 (使 用 迭代 列表 索引 ) 相对 于 遍历 列表 项 的 方法 更 复杂 并 且 不 直观 。 那 么 为 
什么 要 使 用 它 呢 ? 
的 确 存在 必须 按 索 引 而 不 是 按 值 迭 代 序 列 的 情况 。 例 如 ， 考 虑 检查 一 个 数值 列表 1st 
是 否 按 递增 顺序 排序 的 问题 。 要 做 到 这 一 点 ， 必 须 检查 列表 中 的 每 一 个 数值 是 否 比 下 一 个 数 
值 (如 果 存 在 下 一 个 数值 的 话 ) 要 小 。 让 我 们 通过 遍历 列表 中 的 项 来 实现 这 个 方法 : 


for item in lst: 


# 此 处 把 item 和 列表 1st 中 的 下 一 个 对 象 比较 
我 们 被 卡 住 了 。 应 该 如 何 将 列表 项 与 其 后 面 的 项 比较 呢 ? 问题 是 我 们 无 法 获取 列表 1st 中 
对 象 item 之 后 的 对 象 。 
如 果 通 过 列表 索引 而 不 是 列表 项 迭代 列表 ， 则 有 如 下 解决 方法 : 索 引 i 位 置 的 项 之 后 的 
项 位 于 索引 位 置 i+1: 


for i in range(len(lst)): 
# 比较 1lst[i] 和 1lst[i +1] 


下 一 个 要 解决 的 问题 是 如 何 比较 lst[i] 和 1st[i +1]。 如 果 条 件 1st[i] < 


lst[i +1] 为 真 ， 我 们 无 需 做 任何 处 理 ， 直 接 可 以 检查 循环 中 的 下 一 对 相 邻 数据 。 如 果 条 
件 为 假 ( 即 1st[i] > lst[i +1])， 则 我 们 知道 1st 不 可 能 为 升序 排列 ， 因 此 可 以 直接 
返回 False。 所 以 ,我 们 只 需要 在 for 循环 中 增加 一 条 单 分 文 if 语句 : 


for i in range(len(lst)): 
if lst[i] >= lst[i+1]: 
return False 

在 上 述 循环 中 ， 变 量 i 被 赋值 为 列表 1st 的 索引 。 对 于 i 的 每 一 个 值 ， 我 们 检查 位 置 
i 的 对 象 是 否 大 于 或 等 于 位 置 i+1 的 对 象 。 如 果 满 足 条 件 ， 则 返回 False。 如 末 for 循环 
终止 ， 则 意味 着 列表 1st 中 所 有 相 邻 的 两 个 对 象 都 按 升 序 排列 ， 因 此 整个 列表 按 升 序 排列 。 

事实 证 明 我 们 在 这 个 代码 中 犯 了 一 个 错误 。 注 意 ， 我 们 依次 比较 在 索引 0 和 1、1 和 2、 
2 和 3， 直 到 索引 Len(1L1st)-1 和 1len(1st) 位 置 的 项 。 但 是 在 索引 len(1st) 位 置 不 存 
在 项 。 换 言 之 ， 我 们 无 需 把 最 后 一 个 列表 项 与 列表 中 的 “下 一 个 项 ”进行 比较 。 我 们 需要 做 
的 是 把 for 循环 迭代 的 范围 缩小 1。 

下 面 是 最 终 的 函数 形式 的 解决 方案 。 函 数 市 一 个 列表 作为 输入 参数 。 如 采 列 表 不 是 升序 
排列 ， 则 返回 True; 否则 返回 False。 


模块 : ch5.py 


def sorted(1st) : 
' 如 果 1st 升序 排列 ， 则 返回 True; 否则 返回 False。， 
for i in range(0, len(]lst)-1): #1i=0, 1, 2,... ,， len(lst)-2 
BE lst[lil] > SEE 
return False 
return True 


Si 编写 函数 arithmetic()， 带 一 个 整数 列表 作为 输入 参数 。 如 果 这 些 整 
数 构 成 一 个 等 差 数 列 (如果 一 个 整数 列表 中 连续 两 个 项 目的 差 相 同 ， 则 这 个 整数 系列 称 为 等 
差 数 列 )， 则 返回 True; 否则 返回 False。 


>>> arithmetic(t3, 6, 9: 12，15]) 
True 

>>> Tea。 9 14; 414]) 
False 

>>> arithmetic([3]) 

True 


5.2.3 ”循环 模式 : 累加 希 循 环 


循环 的 一 种 常见 模式 是 在 循环 的 每 次 迭代 中 累积 “东西 ”"。 例 如 ， 给 定 一 个 数值 列表 
numList， 我 们 希望 计算 数值 的 累积 和 。 可 以 使 用 for 循环 实现 这 个 目的 。 我 们 首先 需要 
引入 一 个 保存 累积 和 的 变量 mysum。 初 始 化 变量 mySum 为 0， 然后 可 以 使 用 一 个 for 循环 
语句 迭代 列表 numList 中 的 数值 并 把 它们 累加 到 mysum。 例 如 : 

>>> nMLigt = [3 2 7, a1, HN 


>>> mySum = 0 # 初始 化 累加 器 
>>> for num in numList: 


执行 三 制 结 榴 115 


mySum = mySum + num # 累加 到 累加 器 
# 列表 numList 中 的 数值 之 和 
>>> mySum 
20 


上 述 for 循环 语句 的 执行 过 程 如 图 5-3 所 示 。 





mySum = 0 
num = | 总 mySum = mySum + num = 3 
num = | 2 ] mySum = mySum + num = 5 
num = mySum = mySum + num = 12 
num = -] mySum = mySum + num = 11 
num = 9 mySum = mySum + num = 20 


图 5-3 ”累加 器 模式 。for 循环 语句 迭代 列表 numList 中 的 数值 。 每 次 迭代 中 ， 通 过 赋值 语 
句 “mySum = mySum + num”, 把 当前 的 数值 罕 加 到 累加 右 mySum 中 

变量 mySum 的 作用 是 累加 器 。 在 此 例 中 ， 这 是 一 个 整数 些 加 大 ,被 初始 化 为 0， 因 为 
累加 整数 ，0 是 加 法 的 单位 元 〈( 即 0 不 影响 累加 结果 )。 每 个 num 值 都 通过 赋值 语句 累加 到 
索 加 人 顶 : 

mySum = mySum + num 

在 赋值 运算 符 = 的 右 侧 表达 式 中 ，num 的 值 和 当前 累加 需 mySum 的 值 累 加 在 一 起 ， 然 
后 赋值 语句 把 累加 结果 重新 赋值 给 累加 器 mySum。 我 们 称 之 为 mySum 递增 了 num 值 。 该 
操作 非常 常见 ， 存 在 一 个 简洁 书写 方法 (复合 赋值 语句 ): 

mySum += num 

让 我 们 使 用 复合 赋值 语句 重新 计算 sum: 


>>> mySum = 0 
>>> for num in DumList : 
mySum += num 


我 们 把 这 种 for 循环 模式 称 为 累加 器 循环 模式 。 


5.2.4 其 他 类 型 的 累加 


下 面 通过 奉 干 其 他 示例 进一步 阐述 累加 颖 模式 。 回 顾 第 2 革 ， 我 们 介绍 了 内 置 限 数 
sum( ) ， 用 于 计算 一 个 列表 中 的 值 之 和 : 


>>> sum(numList) 

20 
因此 ， 编 写 一 个 for 循环 来 计算 列表 中 数值 之 和 其 实 没 有 必要 。 然 而 ,通常 没有 可 用 的 内 
置 哨 数 。 例 如 ,假如 我 们 希望 把 列表 中 的 所 有 数值 相 乘 ? 可 以 采用 类 似 于 上 述 累 加 和 的 方法 
解决 此 问题 : 


>>> myProd = 0 # 初始 化 乘积 

>>> for num in numList: # num 从 numList 中 获取 值 
myProd = myProd * num  # myProd 乘 以 num 

>>> myProd # 为 什么 结果 不 正确 呢 ? 

0 


究 竞 哪儿 出 错 了 呢 ?” 我 们 将 乘法 累积 器 myProd 初始 化 为 0。 问题 是 0 乘 以 任何 数 结果 
都 是 0。 当 myProd 乘 以 numList 中 的 每 个 值 ， 结 果 永 远 返 回 为 0。 初 始 化 累加 和 时 ， 值 
0 是 正确 的 选择 ， 因 为 0 是 加 法 运算 符 的 单位 元 。 乘 法 运算 符 的 单位 元 值 为 1: 

>>> myProd = 1 


>>> for num in numList: 
myProd = myProd * num 


>>> myProd 
-378 


实现 函数 factorial()， 带 一 个 非 负 整 数 作 为 输入 参数 ， 返 回 其 阶乘 。 
一 个 非 负 整数 于 的 阶乘 表示 为 刀 ， 其 定义 为 : 


1 ifn=0 
nl!= 
nx(n—l)x(n—2)x...x2x1 ifn>0 


因此 ，0!=1，3!=6，5$!= 120。 


>>> factorial (0) 
1 

>>> factorial(3) 
6 

>>> factorial (5) 
120 


在 累加 天 模式 的 前 两 个 示例 中 ， 累 加 需 用 于 数值 类 型 。 如 果 我 们 累加 (拼接 ) 字符 到 字 
符 串 ， 则 累加 需 应 该 为 字符 串 。 那 么 ,字符 串 累 加 顺应 该 初始 化 为 什么 值 呢 ? 它 必 须 为 字符 
串 拼 接 的 单位 元 ( 即 具 有 如 下 属性 : 当 和 其 他 字符 拼接 时 ， 结 果 字 符 串 仅仅 是 该 字符 )。 因 
此 ， 空 字符 串 " (注意 不 是 空格 ! ) 是 字符 串 拼接 的 单位 元 。 


缩 略 词 是 一 个 短语 中 每 个 单词 的 第 一 个 字母 组 成 的 单词 。 例 如 ，RAM 是 
random access memory 的 缩 略 词 。 编 写 一 个 函数 acronym( ) ， 训 一 个 短语 ( 即 一 个 字符 囊 ) 
作为 输入 参数 ， 返回 该 短语 的 缩 略语 。 注 意 ， 缩 略语 应 该 全 大 写 ， 即 使 短语 中 的 单词 不 是 
天 每 。 

>>> acronym('Random access memory') 

'RAM' 


>>> acronym('central processing unit') 
GRY" 


如 采 把 对 象 么 加 到 列表 ， 则 累加 需 应 该 是 一 个 列表 。 那 么 ， 列 表 拼 接 的 单位 元 是 什么 ? 
它 是 空 列表 [ ] 。 


编写 函数 aivisors()， 带 一 个 正 整数 冉 作 为 输入 参数 ， 输 出 包含 于 的 
所 有 正 因 子 的 列表 。 
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>>> divisors(1) 
加 

>>> divisors(6) 
ji We 0 
>>> divisors(11) 
本 


5.2.5 循环 模式 : 藤 套 循环 


假设 希望 开发 一 个 函数 nested( ) ， 带 一 个 整数 作为 输入 参数 ， 在 屏幕 上 输出 7 行 
数据 : 


Dh 
0 n-1 
0 防 有 n-1 
0 I < n-1 
例如 : 

> 

>>> nested(n) 

人 诗人 总 到 

人 二 全 衣 进 

人 王 人 总 丰 

人 芋 全 吉 冯 

全 二 也. 吉 "到 


如 前 所 述 ， 为 了 输出 其 中 一 行 ， 可 以 使 用 如 下 方法 实现 ， 


>>> for i in range(n) : 
print(i,end=' ') 


全 


为 了 输出 n 个 这 样 的 行 (本 例 是 5 行 )， 我 们 要 做 的 就 是 重复 n 次 (本 例 为 5 次 )。 我 们 
可 以 使 用 为 一 个 外 部 for 循环 来 实现 ， 重复 执行 内 部 的 for 循环 : 


>>> for j in range(n): # 外 循环 迭代 5 次 
for 1 in range(n): # 内 循环 输出 0 1 2 3 4 
print(i, end = ' ') 


4 


哎呀 ， 结 果 并 不 符合 要 求 。 语 名 print(i，end='， ') 强制 所 有 的 数值 输出 在 一 行 之 中 。 
我 们 希望 在 输出 每 个 序列 0 1 2 3 4 后 换行 。 换 言 之 ， 我 们 需要 在 每 次 内 循环 之 后 调用 不 带 参 
数 的 print() 子 数 。 内 循环 是 : 


for i in range(n): 
print(i, end = ' ') 


最 终 的 解决 方案 如 下 : 
模块 : ch5.py 


def nested(n): 
”输出 n 行 ,每 行内 容 为 0 1 2 …n -1' 
for j in range(n):# 重复 nm 次 : 


for 1 in range(n): 并 精 出 0、 "…、 到 =1 
print(is end = ' ') 
print() # 光标 移动 到 下 一 行 


注意 ， 外 部 for 循环 中 使 用 的 变量 和 内 部 for 循环 中 使 用 的 变量 名 称 应 该 不 同 。 
在 该 程序 中 ， 一 个 循环 语句 包含 在 男 一 个 循环 语句 中 。 我 们 把 这 种 循环 模式 称 为 诅 套 御 
环 模式 。 骸 套 循 环 模式 可 以 包含 两 重 以 上 的 散 套 循环 。 


编写 一 个 函数 xmult()， 带 丙 个 整数 列表 作为 输入 参数 ， 输 出 一 个 列 
表 ， 包 括 所 有 第 一 个 列表 的 整数 与 第 二 个 列表 的 整数 的 乘积 。 


-> |) 

[ 受 ， 瑟 加 

> :mmalt( [2 YM [lL 到 》 
[2 oO， 号， 

25 xmlttL3 Ww YW [2 0 
bo 2 0 9 A 水 | 


假如 我 们 希望 编写 另 一 个 图 数 nested2 ( ) ， 市 一 个 正 整数 作为 输入 参数 ， 在 屏幕 上 输 
出 即行 : 


0 

@ 1 

0 
GO > 

@ 二 和 过 se =- 
例如 : 

>>> nested2(5) 
0 

0 1 

人 中远 

0 Wl We | 

人 0 和 这 时 和 


应 该 怎样 修改 消 数 nested( ) 以 创建 这 些 输 出 呢 ? 在 nested() 中 ， 对 于 每 一 个 变量 
j 的 值 ， 输 出 完整 的 行 0 1 2 3 … n-1。 现 在 我 们 需要 做 的 是 : 

当 j 为 0 时 ,输出 0。 

当 村 为 1 时 ， 输 测 0 4。 

daa Fan 


内 循环 变量 i 需要 在 值 0、 …、jj 的 对 应 的 范围 range(j+1) 上进 代 ， 而 不 是 
在 range(n) 上 迭代 。 pe 
模块 : ch5.py 


def nested2(n): 
5 对 于 了 宇和 5 和 
for j in range(n): lL 
for 1 in range(j+1): 输出 0 1 2 3 
print(i, end=' ') 
Brint () # 移动 到 下 一 行 
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把 一 个 包含 nn 个 不 同 数值 的 列表 按 升序 排列 的 方法 是 在 列表 中 执行 n 一 1 
轮 比 较 操 作 。 每 轮 比 较 操 作 比 较 列 表 中 所 有 相 令 的 数字 ， 如 果 它 们 顺序 不 正确 ， 则 交换 它 
们 。 在 第 一 轮 比 较 操 作 结 来 后 ， 最 大 的 项 将 是 列表 中 的 最 后 一 个 (位 于 索引 1-1)。 因 此 ， 
第 二 轮 比 较 操 作 可 以 在 到 达 最 后 一 个 元 素 之 前 停止 ， 因 为 最 后 一 个 元 素 已 经 处 于 正确 的 位 
置 ; 第 二 轮 比 较 操 作 将 把 第 二 大 的 元 素 放 在 倒数 第 二 个 位 置 。 一 般 来 说 ， 第 工 轮 比较 操作 将 
比较 索引 0 和 1、1 和 2、2 和 3、…， 以 及 i-1 和 i 的 数值 对 ; 在 第 i 轮 比 较 操 作 之 后 ， 第 i 
个 最 大 的 项 目 将 位 于 索引 n-i。 因 此 ， 执行 n 一 1 轮 比 较 操 作 后 ， 列 表 将 处 于 升序 状态 。 

编写 一 个 函数 bubbleSort())， 带 一 个 数值 列表 作为 输入 参数 ,使 用 上 述 方法 对 列表 
进行 排序 。 


ns 
>>> bubblesort (lst) 

> 由 三 起 

[Lis 9 和 


5.3 深入 研究 列表 : 二 维 列表 
迄今 为 止 ， 我 们 讨论 的 列表 可 以 看 作 是 一 维 表 。 例 如 ， 对 于 以 下 列表 : 
By Te [3 5 D9 


可 以 看 作 是 如 下 一 维 表 : 





在 Python 中 ， 一 维 表 很 容易 使 用 列表 来 表示 。 那 么 ， 类 似 如 下 的 二 维 表 呢 ? 








在 Python 中 ， 二 维 表 可 以 表示 为 列表 的 列表 ， 又 被 称 为 二 维 列表 。 
5.3.1 二 维 列表 


二 维 表 可 以 看 作 是 春 干 行 〈 或 一 维 表 ) 组 成 的 表 。 这 正 是 二 维 表 在 Python 中 表示 的 方 
式 : 列表 元 素 的 列表 ， 每 个 列表 元 素 对 应 于 表 的 一 行 。 例 如 ， 上 文 的 二 维 表 在 Python 中 表 
示 如 下 : 

> 0 

六 和 六 刺 

0 SR ~ es | 0 


列表 七 的 示意 图 如 图 5-4 所 示 。 注 意 , t[0] 对 应 于 表 的 第 1 行 ，t[1] 对 应 于 表 的 第 2 
行 ，t[2] 对 应 于 表 的 第 3 行 。 验 证 如 下 : 

> 市 [O] 

[未 、 孕 这 ， 昼 

3 攻 和 ] 

[5 了 海 一 5 


120 党 和 全 


到 目前 为 止 ， 这 里 并 没有 涉及 新 的 知识 点 : 我 们 知道 一 个 列表 可 以 包含 另 一 个 列表 。 这 
里 的 特殊 之 处 是 每 个 列表 元 素 的 大 小 相同 。 那 么 ， 该 如 何 访问 《〈 恋 或 写 ) 单个 表 的 项 呢 ? 一 
个 二 维 表 中 的 项 通 稼 通过 它 的 “坐标 ”( 即 它 的 行 索引 和 列 索引 ) 来 访问 。 例 如 ,， 值 8 在 表 中 
位 于 第 2 行 ( 从 最 上 面 的 一 行 开始 计数 ， 从 索引 0 开始) 和 0 列 (从 最 左边 的 列 开始 计数 )。 
换言之 ，8 位 于 列表 t[21] 的 索引 0 位 置 ， 或 者 t[2][0] 位 置 (参见 图 5-4 )。 一 般 而 言 ， 
位 于 二 维 列表 七 第 工行 第 j 列 的 项 可 以 通过 表达 式 t[i][j] 来 访问 : 


>>> 十 [2 [0] # 位 于 第 2 行 第 0 列 的 元 素 
8 
53% [0] {o] # 位 于 第 0 行 第 0 列 的 元 素 
4 
>3> 石 [4j [和 # 位 于 第 1 行 第 2 列 的 元 素 
9 


t[0] [0] t 上 [0] [1 t[0] [2] 上 [0] [3] 


Ne [| fea) el el 


JE 区 EE Li [HE3] 
2 | 3 | 有 | 19 | | 


ttL2] 19 T2111 2] [2) ®t[2] £3 


t[2] | sl ;|| 6 | 6 ] 
图 5-4 ”二 维 列表 。 列 表 t 表示 一 个 二 维 表 。 二 维 表 的 第 1 行 是 t[0], 第 2 行 是 t[1], 第 3 
行 是 t[2]。 第 1 行 的 项 分 别 为 : t[0][0]、t[0][1]、t[0][2] 和 t[0][3]。 第 
2 行 的 项 分 别 为 : t[1][0]、t[1][1]、t[1][2] 和 tf[1][3]。 以 此 类 推 


要 把 一 个 值 赋值 给 第 i 行 第 j 列 的 项 ,我 们 可 以 简单 地 使 用 赋值 语句 。 例 如 : 
yy CE21 L131 
第 i 行 第 j 列 的 项 现在 是 7: 


> > 
LU TY 2 Bis WW: 4. Se 2ly LBs 3, 83 21 


有 时 我 们 需要 以 茶 种 顺序 访问 二 维 列表 的 所 有 项 ， 而 不 仅仅 是 位 于 指定 行 和 列 中 的 一 个 
项 。 要 系统 地 访问 二 维 列 表 的 项 ， 可 以 使 用 散 套 循环 模式 。 


5.3.2 ”二 维 列 表 和 共 套 循环 模式 


当 我 们 输出 二 维 列表 t 的 值 时 ， 输 出 的 结果 是 一 个 列表 的 列表 ， 而 不 是 位 于 各 行 的 表 。 
通常 ， 输 出 二 维 列表 的 内 容 也 不 错 ， 因 为 它 看 起 来 像 一 个 表 。 下 一 个 方法 使 用 迭代 模式 在 单 
独 的 行 中 打印 表 的 每 一 行 : 

2 

print (row) 
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假如 我 们 不 希望 打印 表 的 每 一 行为 一 个 列表 ， 而 希望 有 一 个 阴 数 print2D())， 打印 七 
中 的 项 如 下 所 示 : 


>>> print2D(t) 

和 了 全力 

号 二 人, 进 

83617 

我 们 使 用 舱 套 循环 模式 实现 这 个 图 数 。 外 部 for 循环 用 于 产生 行 ， 而 内 部 for 循环 则 
迭代 行 中 的 项 并 输出 : 


模块 : ch5.py 


def Print2D(t) : 
”输出 二 维 列表 的 值 为 一 个 二 维 表 ， 
for ToOw in t: 
for item in row: 
print (item, end=' ') # 输出 项 ， 后 跟 一 个 空 
print() # 移动 到 下 一 行 


让 我 们 再 讨论 一 个 示例 。 假 如 我 们 硕 望 开发 一 个 明 数 incr2D( ) ， 把 一 个 数值 二 维 列表 
中 的 每 个 数值 递增 1， 

>>> print2D(t) 

4728 

+ 轴 

S38 

> Ler2DGey 

>>> print2D(t) 

S836 

S20 

9478 


显 而 匈 见 ， 国 数 incr2D( ) 需要 针对 输入 参数 二 维 列 表 七 中 的 每 个 行 索引 i 和 列 索 引 
j 执行 如 下 语句 : 
GL = 评 


我 们 可 以 使 用 散 套 循环 模式 生成 所 有 行 索 引 和 列 索 引 的 组 合 。 

外 循环 应 该 生成 上 的 行 索引 。 因 此 ， 我 们 需要 知道 上 的 行 数 。 它 就 是 1en (t) 。 内 循环 
应 该 生成 的 列 索 引 。 这 里 我 们 遇 到 了 麻烦 。 如 何 确 定 七 有 多 少 列 呢 ? 它 实 际 上 是 一 行 中 
的 项 的 个 数 。 由 于 我 们 假定 所 有 行 都 有 相同 数量 的 项 ， 所 以 我 们 可 以 随意 选择 第 一 行 来 获得 
列 的 数目 len(t[0])。 现 在 我 们 可 以 实现 该 限 数 : 


模块 : ch5.py 


def incr2D(t): 
' 把 数值 二 维 列 表 中 每 个 数值 说 增 1 ， 


nrows = len(t) # 行 数 
ncols = len(t[0]) # 列 数 
for i in range(nrows): # 并 是 行 索 引 
for j in range(ncols): # j 是 列 索 引 


[于] 和 er 于 


该 程序 使 用 通 套 循环 模式 逐 行 自 左 向 右 自 顶 向 下 访问 二 维 列 表 t 中 的 项 。 首 先 访问 的 是 
第 0 行 的 各 项 ， 依 次 为 上 [01T01T、tT01fIT、 t+10112] 和 [0]1T31s。 如 图 5$55 所 示 。 人 然 
后 ， 从 左 到 右 访问 第 1 行 的 各 项 ， 最 后 访问 第 2 行 的 各 项 。 





图 5-5 骨 套 循环 模式 。 外 部 for 循环 产生 行 索 引 。 内 部 for 循环 产生 列 索引 。 箭 头 摘 述 了 第 
1 行 (索引 0) 的 内 部 for 循环 的 执行 流 


3 四 编写 一 个 函数 add2D， 带 两 个 相同 大 小 (即行 列 数 都 相同 ) 的 二 维 列表 
作为 输入 参数 ， 把 第 一 个 列表 中 的 每 个 项 增加 第 二 个 列表 中 对 应 的 项 的 值 。 
> 0 1 
了 
>>> add2D(t,s) 
3 
print (row) 


| 
6 这 
[LS 4 6, 


5.4 _ while 循环 


除了 for 循环 ，Python 还 有 男 外 一 个 更 通用 的 迭代 控制 结构 : while 循环。 为 了 理解 
while 循环 是 如 何 工 作 的 ， 我 们 首先 回顾 一 下 单 向 if 语句 是 如 何 工 作 的 : 
if < 条 件 >: 


< 缩 进 代码 块 > 
< 非 缩 进 语句 > 


当 < 条 件 > 求 值 结果 为 True 时 ， 则 执行 < 缩 进 代码 块 >。 执 行 完 < 缩 进 代码 块 > 后 ， 
将 继续 执行 < 非 缩 进 语句 >。 如 果 < 条件 > 求 值 结 果 为 False， 则 程序 直接 转向 < 非 缩 进 
语句 >。 

while 语句 的 语法 格式 和 单 分 支 if 语句 的 语法 格式 类 似 : 

while < 条 件 >: 


< 缩 进 代码 块 > 
< 非 缩 进 语句 > 


和 if 语句 类 似 ， 在 while 语句 中 ， 当 < 条 件 > 求 值 结 果 为 True 时 ， 则 执行 < 缩 进 代 


码 块 >。 但 是 当 执 行 完 < 缩 进 代码 块 > 后 ,程序 执 行 重新 返回 并 检查 < 条件 > 求 值 结果 是 否 
为 True。 如 果 满 足 条 件 ， 则 重新 执行 < 缩 进 代 码 块 >。 只 要 < 条 件 > 求 值 结果 为 True， 则 
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不 断 重 复 执行 < 缩 进 代码 块 >。 当 < 条 件 > 求 值 结果 为 False， 则 跳 转 到 < 非 缩 进 语句 >。 
图 5-6 中 的 while 循环 流程 图 描述 了 可 能 的 执行 路 径 。 





= » 
| < 提 纺 进 语句 > | 


图 5-6 while 语句 流程 图 。 只 要 条 件 的 求 值 结果 为 True， 则 重复 执行 条 件 语 句 模 块 。 当 条 
件 的 求 值 结 果 为 False， 则 执行 紧 跟 在 while 循环 语句 后 的 语句 


while 循环 的 用 法 
while 循 环 何 时 有 用 ?” 我 们 用 下 一 个 问题 说 明 这 一 点 。 假 设 我 们 有 一 个 奇怪 的 想法 : 


计算 大 于 3 951 的 73 的 第 一 个 倍数 。 解 决 这 个 问题 的 一 种 方法 是 连续 生成 73 的 正 倍数 ， 直 
到 大 于 3 951。 该 思想 的 for 循环 实现 可 以 从 下 列 语句 着 手 : 


for multiple in range(73，???，73) 上 上 : 


我 们 尝试 使 用 孔 数 range( ) 生成 73 的 倍数 : 73、146、291、…。 但 是 ， 什 么 时 候 终 
止 呢 ? 换 言 之 ,该 用 什么 数值 替换 “???”? 

当 我 们 需要 迭代 但 不 知道 只 代 多 少 次 时 ，while 循环 为 此 提供 了 完美 的 解决 方案 。 在 
我 们 的 例子 中 ， 我 们 需要 持续 生成 73 的 倍数 ， 只 要 倍数 <=3 951。 换 言 之 ， 当 倍数 
<=3 951， 则 生成 下 一 个 倍数 。 让 我 们 翻译 成 Python 语句 : 

while multiple “= 3951 : 

multiple += 73 

在 while 循环 之 前 ， 必 须 先 初始 化 变量 multiple。 我们 可 以 把 它 初始 化 为 73 的 第 1 
个 正 倍数 ， 即 73。 在 while 循 环 的 每 次 迭代 中 ,检查 条 件 multiple <= 3951。 如 果 条 
件 为 True， 则 multiple 增加 到 下 一 个 73 的 倍数 : 

>>> bound = 3951 

>>> multiple = 73 


>>> While multiple “= bound: 
multiple += 73 


>>> multiple 
4015 


当 while 循环 条 件 的 求 值 结果 为 False 时 ,循环 执行 终止 ，multiple 的 值 大 于 
bound。 因 为 前 一 个 multiple 的 值 不 大 于 bound， 因 此 它 就 是 我 们 所 求 的 值 ， 大 于 
bound 的 最 小 倍数 。 


A 


Y 


人 


124 过 


编写 一 个 函数 interest()， 带 一 个 浮 点 数 利率 (例如 ，0.06， 对 应 于 
6% 利率 ) 作为 输入 参数。 另 数 计算 并 返回 一 笔 投 资 价 值 翻 倍 所 需要 的 时 间 (年 数 )。 注 意 : 
一 笔 投 资 价 值 翻 倍 所 需 的 时 间 与 原始 投资 额 无 关 。 


>>> interest (0.07) 
| 


5.5 更 多 循环 模式 


掌握 了 while 循环 以 及 我 们 将 介绍 的 另外 一 些 循环 控制 结构 之 后 ， 我 们 可 以 开发 更 多 
有 用 的 循环 模式 。 


5.5.1 循环 模式 : 序列 循环 

有 些 问题 ， 特 别 是 来 自 科 学 、 工 程 学 和 金融 学 的 问题 ， 可 以 通过 生成 一 系列 最 终 达 到 期 
望 数值 的 数字 来 解决 。 我 们 以 者 名 的 裴 波 那 契 数列 来 说 明 这 种 模式 : 

1 

斐 波 那 契 数列 是 从 整数 1 和 1 开始 的 ， 随 后 的 数字 满足 如 下 规则 : 序列 中 的 当前 数 是 序 
列 中 前 两 个 数字 之 和 。 


拓展 知识 : 斐 波 那 契 数 列 

斐 波 那 契 数列 是 以 比萨 的 列 奥 纳 多 (他 被 称 为 斐 波 那 契 ) 命名 的 ， 他 把 斐 波 那 契 数列 
引入 了 西方 世界 。 这 个 序列 在 印度 数学 家 中 时 就 知道 了 。 

斐 波 那 契 开 发 该 序列 作为 一 个 理想 化 的 兔子 种 群 增长 的 模型 。 他 认为 (1) 兔子 能 在 
一 个 月 大 的 时 候 交 配 ,(2) 小 兔子 出 生 需 要 一 个 月 的 时 间 。 在 第 i 个 月 的 月 末 免 子 对 的 数 
目 可 以 用 第 i 个 斐 波 那 契 数 描述 如 下 : 

。 最 初 ， 在 第 1 个 月 的 开始 ， 只 有 一 对 兔子 。 

。 在 第 1 个 月 的 月 末 ， 第 1 对 兔子 交配 但 还 是 只 有 1 对 兔子 。 

。 在 第 2 个 月 的 月 末 ， 第 1 对 兔子 产 下 了 一 对 兔子 ， 并 继续 交配 ， 因 此 有 2 对 兔子 。 

。 在 第 3 个 月 的 月 末 ， 第 1 对 兔子 又 产 下 了 一 对 兔子 ， 并 继续 交配 。 第 2 对 兔子 交配 但 

还 没有 产 下 后 代 。 现 在 有 3 对 兔子 。 

。 在 第 4 个 月 的 月 末 ， 第 1 对 兔子 和 第 2 对 兔子 分 别 产 下 一 对 兔子 ， 因 此 有 5$ 对 兔子 。 


一 个 自然 的 问题 是 计算 第 i 个 韭 波 那 契 数 。 本 章 最 后 的 思考 题 5.32 要 求 谈 者 完成 该 任 
务 。 现 在 我 们 要 解决 一 个 稍微 不 同 的 问题 。 我 们 希望 计算 第 一 个 大 于 给 定 整 数 大 小 的 斐 波 那 
契 数 。 我 们 将 通过 生成 裴 波 那 契 数列 来 完成 这 项 工作 ， 当 我 们 到 达 一 个 大 于 所 限定 边界 的 数 
时 ， 就 停止 。 因 此 ， 假 如 当前 的 斐 波 那 契 数 是 current， 则 while 循环 条 件 是 : 

while current <= bound : 

如 果 条 件 为 真 ， 则 需要 计算 下 一 个 斐 波 那 契 数 ， 换 言 之 ， 计 算 current 的 下 一 个 
值 。 为 了 计算 ， 必 须 保 留 current 之 前 的 斐 波 那 契 数 。 因 此 ， 除 了 当前 斐 波 那 契 数 的 变 
量 current 之 外 ， 我们 需要 男 一 个 变量 ,例如 previous。 在 while 循环 之 前 ,我 们 把 
previous 和 current 初始 化 为 第 1 个 和 第 2 个 斐 波 那 契 数 . 
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模块 : ch5.py 


def fibonacci(bound) : 

' 返回 大 于 bound 的 最 小 斐 波 那 契 数 ， 

Previous = 1 # 第 1 个 斐 波 那 契 数 

current = 1 # 第 2 个 斐 波 那 契 数 

While current <= bound : 
# current 变 为 previous，, 重新 计算 新 的 current 
previous, current = current, previoust+current 

return current 


注意 ,使 用 系列 解 包 赋值 语句 来 计算 下 一 个 current 和 previous 的 值 。 

在 滑 数 fibonacci() 中 ,使 用 循环 语句 来 计算 一 个 数值 序列 直到 满足 某 种 条 件 为 止 。 
我 们 称 这 类 循环 模式 为 序列 循环 模式 。 在 下 一 个 问题 中 ， 我们 使 用 序列 循环 模式 来 求 数学 常 
数 e ( 称 之 为 欧 拉 篆 数 ) 的 近似 值 。 


众所周知 ，e 的 精确 值 等 于 下 列 无 穷 序 列 之 和 : 





二 :| 


一 - 一 十 一 十 一 十 一 十 
Qf 1 者 34 4! 介 
无 限 之 和 是 不 可 能 计算 的 。 通 过 计算 无 穷 和 中 的 前 几 个 项 之 和 ， 我 们 可 以 得 到 @ 的 近似 


1 EF ] ] 
值 。 例 如 ， 有 1] 是 e 的 一 个 (糟糕 的 ) 近似 。 下 一 个 计算 和 e， 2 稍微 好 些 ， 
] ] ] si ey 
但 还 是 比较 差 。 下 一 个 计算 和 @, = pr 则 看 起 来 更 好 。 接 下 来 的 若干 计算 和 
则 向 正确 的 方向 趋 近 : 
] ] 


] ] 
= 一 0 ai 
Ue 


= -一 + 一 + 一 + 一 十 
OF 1 2 诸 31 #4! 
Sp ge 3 

现在 ， 因 为 e, 一 e， = 本 > 本 +， 我 们 知道 es 和 实际 的 e 值 相 差 在 范围 了 之 内 。 这 
给 我 们 提供 了 一 种 计算 e 的 近似 值 的 方法 ， 它 保证 近似 值 与 e 的 真 值 的 误差 在 给 定 范围 之 内 。 

编写 一 个 函数 apptroxBE()， 带 一 个 浮 点 数 error 作为 输入 参数 ， 返 回 误差 在 error 
范围 内 的 种 数 e 的 近似 值 。 可 以 通过 生产 系列 近似 值 el、ej、e、…， 直 到 当前 的 近似 值 与 
前 一 个 近似 值 之 间 的 误差 不 大 于 error。 

>>> approxE(0.01) 

2.7166666666666663 


>>> approxE(0.000000001) 
2.7182818284467594 


5.5.2 ”循环 模式 : 无 限 循环 
while 循环 可 以 用 来 创建 一 个 无 限 循环 ， 即 “永远 ”运行 的 循环 : 


while True : 


< 缩 进 代码 块 > 
因为 True 永远 为 真 ， 因 此 将 不 断 重 复 执 行 < 缩 进 代码 块 >。 


无 限 循环 适用 于 无 限期 提供 服务 的 程序 。Web 服务 器 〈( 即 提供 Web 页 面 的 程序 ) 是 提供 
服务 的 程序 的 一 个 示例 。 它 不 断 接 受 Web 页 面 请 求 (来 自 你 或 者 他 人 的 浏览 器 )， 然 后 返回 
请 求 的 Web 页 面 。 下 一 个 示例 说 明了 无 限 循环 模式 在 一 个 更 简单 的 “问候 服务 ”中 的 使 用 。 

我 们 将 编写 一 个 果 数 hello2()， 重复 请 求 用 户 输入 他 们 的 姓名 ， 当 用 户 输入 完毕 并 按 
【 Return 】 键 后 ， 输 出 问候 信息 : 


>>> hello2() 

What is your name? Sam 
Hello Sam 

What is your name? Tim 
Hello Tim 


下 面 是 一 个 简单 的 实现 ， 它 使 用 了 无 限 循环 模式 : 


模块 : ch5.py 


def hello2(): 
'' 一 个 问候 服务 ; 重复 请 求 用 户 输入 他 们 的 姓名 ， 
并 输出 问候 信息 。''，' 
while True: 
name = input(' What 1S your name? ry 
print('Hello {}'.format (name)) 


如 何 停 止 使 用 无 限 循环 模式 的 程序 ?任何 正在 运行 的 程序 ， 包括 一 个 运行 无 限 循环 的 程 
序 ， 都 可 以 从 程序 外 部 通过 按 (注意 要 同时 ) 键盘 上 的 【 Ctrl + C ] 键 终止 (准确 地 说 ， 中 
汤 )。 读 者 可 以 使 用 这 种 方法 来 停止 上 述 hello2() 因数 的 执行 。 


5.5.3 ”循环 模式 : 循环 和 折 半 


当 程 序 必须 重复 处 理 一 些 输入 值 直到 一 个 标志 到 达 时 ， 应 该 使 用 while 循环 。( 标 志 是 
用 于 指示 输入 结束 的 任意 值 )。 

更 具体 地 说 ， 考 虑 开发 一 个 图 数 cities()， 重复 地 请 求 用 户 输入 城市 名 称 ( 即 字符 
串 )， 并 存储 在 一 个 列表 中 。 用 户 通 过 输入 空 字符 串 指 示 输 入 的 结束 ， 此 时 函数 返回 用 户 输 
入 的 所 有 城市 的 列表 。 期 望 的 运行 结果 如 下 : 

>>> cities() 

Enter city: Lisbon 

Enter city: San Francisco 

Enter city: Hong Kong 

Enter city: 

['Lisbon’, I'San Francisco"s "Hong Kong '] 

>>> 

如 来 用 户 没 有 输入 任何 城市 ， 则 返回 一 个 空 的 列表 : 

>>> cities() 


Enter city: 
[] 


显然 ， 图 数 cities() 应 该 使 用 循环 来 实现 ， 在 每 次 迭代 中 以 交互 方式 请 求 用 户 输入 
一 个 城市 。 由 于 事先 不 知 近 迭代 次 数 ， 我 们 需要 使 用 while 循环 。while 循环 的 条 件 应 该 
检查 用 户 是 否 输 入 空 字符 串 。 这 意味 着 在 进入 while 循环 之 前 ， 用 户 应 该 被 要 求 输入 第 一 
个 城市 。 当 然 ,， 在 while 循环 的 每 一 次 授 代 中 也 会 要 求 用 户 输 入 一 个 城市 : 
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模块 : ch5.py 


def cities() : 
' 返回 包含 用 户 交 互 式 输入 的 城市 的 列表 
空 字符 串 终止 交互 式 输入 '' 
lst = 0D 


city = input('Enter # 请 求 用 户 输 入 第 一 个 城市 


while city != '': # 如 果 city 不 是 标志 flag 值 
lst.append(city) # 把 city 添加 到 list 
city = input('Enter city: ') # 再 次 请 求 用 户 输入 


return 1 st 


请 注意 ， 该 函数 使 用 累加 屁 循 环 模式 将 城市 累积 到 列表 中 。 

在 孙 数 cities() 中 ， 有 两 次 input() 哺 数 的 调用 : 一 次 在 while 循环 语句 之 前 ， 一 
次 在 while 循环 中 的 代码 块 中 。 消 除 这 些 “ 均 余 ” 语 句 并 使 代码 更 直观 的 一 种 方法 是 使 用 无 
限 循 环 ， 在 while 循环 的 主体 内 使 用 一 个 if 语句 。if 语句 将 测试 用 户 是 否 输 入 了 标志 值 : 


模块 : ch5.py 


def cities2(): 
， 返回 包含 用 户 交 互 式 输入 的 城市 的 列表 
空 字 符 串 终止 交互 式 输入 ' 
lst = [] 


while True: # 无 限 重复 : 
city = input('Enter city: ') # 请 求 用 户 输入 一 个 城市 


if city == '': # 如 果 city 是 标志 值 
return lst # 返回 list 
lst.append(city) # 把 city 添加 到 list 


执行 滑 数 cities2() 时 , while 循环 的 最 后 一 次 迭代 是 当 用 户 输 入 了 空 字符 串 。 
在 这 次 迭代 中 ， 只 执行 for 循环 的 “一 半 ”; 跳 过 语句 lst.append(city)。 因 此 ， 
cities2() 中 的 循环 模式 通常 被 称 为 循环 和 折 半 (loop-and-a-half) 模式 。 


5.6 ”其 他 和 迭代 探 制 语句 


我 们 将 通过 介绍 几 个 Python 语句 来 结束 这 一 草 ， 这 些 语句 提供 了 对 迭代 的 进一步 控制 。 
我 们 使 用 简单 的 例子 ， 以 便 我 们 能 清楚 地 说 明 它 们 是 如 何 工作 的 。 


5.6.1 break 语句 


break 语句 可 以 添加 到 循环 的 代码 块 中 (无论 for 循环 还 是 while 循 环 )。 执 行 
break 语句 时 ,停止 当前 循环 迭代 ， 退 出 循环 ， 然 后 继续 执行 紧 跟 在 循环 语句 后 面 的 语句 。 
如 果 中 断 语句 出 现在 藤 套 循环 模式 的 循环 体 代 码 块 中 ， 则 只 中 断 包 含 preak 语句 的 最 内 层 
循环 。 

为 了 说 明 break 语句 的 用 法 ,我 们 从 男 一 个 也 数 的 实现 开始 ， 该 函数 把 二 维 列 表 中 的 
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数值 输出 为 二 维 表 的 格式 : 
模块 : ch5.py 


def print2D2(table): 
， 输 出 二 维 列表 七 中 的 数值 为 二 维 表 ， 
for row in table: 
for num in row: 


print (num, end=' ') 
print() 
让 我 们 测试 该 代码 : 


>5> aple = [[2, 3, 0 © WS I [4 55 $: 
>>> print2D2(table) 

必 入 全 岂 

O345 

4560 


假设 不 打印 完整 行 ， 我 们 只 希望 打印 行 中 第 一 个 0 之 前 (不 包括 0) 的 数值 。 函 数 
before0() 的 运行 结果 如 下 : 
>>> before0(table) 
2 
A456 


为 了 实现 限 数 before0( )， 我们 修改 阴 数 print2D( ) 的 实现 ， 在 内 部 for 循环 的 代码 
块 中 ， 添 加 一 个 if 语句 检查 当前 num 的 值 是 否 为 0。 如 果 是 ， 则 执行 preak 语句 ， 这 将 终 
止 内 部 for 循环 。 注意，break 语句 不 会 终止 外 部 for 循环 ， 因 此 继续 输出 表 的 下 一 行 。 


模块 : ch5.py 


def before0(table): 
' 输出 二 维 列 表 中 的 数值 为 二 维 表 ; 
仅 输出 各 行 中 第 一 个 0 之 前 的 数值 '，'' 


for row in table: 


for num in row: # 内 部 for 循环 
i TU == 0: # 如 果 num 等 于 0 
break # 终止 内 部 for 循环 


print (num,，end=' ') # 否则 输出 num 
print() # 光标 移动 到 下 一 行 
中 断 语 句 break 不 影响 外 部 for 循环 的 执行 ， 它 将 遍历 表 的 所 有 行 ， 而 不 管 中 断 语句 
是 否 被 执行 。 
5.6.2 continue 语 铝 
continue 霹 句 可 以 添加 到 循环 的 代码 块 中 ， 就 像 break 语 句 一 样 。 当 执行 
continue 语句 执行 时 ,终止 当前 最 内 层 循环 迭代 ， 继 续 执 行当 前 最 内 层 循环 语句 的 下 一 


次 从 代 。 与 break 语句 不 同 ,continue 语句 不 会 终止 最 内 层 循 环 ， 它 只 终止 最 内 层 循环 
的 当前 迭代 。 


为 了 说 明 continue 语句 的 用 法 ， 我 们 修改 滑 数 print2D2()， 不 输出 表 中 0 值 。 改 
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进 的 郴 数 被 称 为 jgnore0( ) ， 其 运行 结果 如 下 : 


>55 bable = [[2，5， 9， 全 ， 0 3 和 到 区 58 人 ]】 
>>> ignore0 (table) 


动 总 和牛 
号, 人 壤 
456 
注意 ， 表 中 的 0 值 被 忽略 。 让 我 们 实现 ignore ( ): 


模块 : ch5.py 


' def ignore0(table) : 
， 输出 二 维 列表 中 的 数值 为 二 维 表 ; 
但 不 输出 0 值 ，'' 


for row ihn table: 


for num in row: # 内 部 for 循环 
if num == 0: # 如 果 num 等 于 0， 终 止 当前 内 部 循环 迭代 
continue # current inner loop iteration 


print (num,，end=' ') # 和 否则， 输出 num 


Print() # 光标 移动 到 下 一 行 


5.6.3 pass 语句 


在 Python 中 ， 每 个 函数 定义 def 语句 、if 语句 、for 语句 、while 循环 语句 必须 有 
一 个 语句 体 ( 即 非 空 缩 进 代码 块 )。 如 果 遗 漏 了 代码 块 ， 则 解析 程序 时 会 发 生 语法 销 误 。 在 
极 少数 情况 下 ， 当 块 中 的 代码 实际 上 不 需要 做 任何 事情 时 ， 我 们 仍然 需要 在 语句 体 中 添加 一 
些 代 码 。 出 于 这 个 原因 ，Python 提供 了 pass 语句 ， 它 不 执行 任何 操作 ， 但 是 一 个 有 效 的 
语句 。 

在 下 一 个 例子 中 ， 我 们 演示 其 用 法 : 在 一 个 代码 片段 中 , 仪 当 n 的 值 是 奇数 时 才 输 出 n 
的 值 。 

if n % 2 == 0: 

pass # 偶数 n 时 ,不 执行 任何 操作 


else: 


print(n)  # 仅 输出 奇数 n 


如 果 n 的 值 是 偶数 ， 则 执行 第 一 个 代码 块 。 这 个 代码 块 只 是 一 个 pass 语句 ， 它 不 执行 
任何 操作 。 

当 Python 语法 需要 代码 (好 数 体 和 执行 控制 语句 的 主体 ) 时 ， 可 以 使 用 pass 语句 。 当 
代码 体 还 没有 实现 时 ， 也 可 以 临时 使 用 pass 语句 。 


5.7 电子 教程 案例 研究 : 图 像 处 理 


在 案例 研究 CS.4 中 ， 我 们 学 习 了 如 何 使 用 Python 处 理 图 像 。 特 别 地 ， 我 们 将 讨论 如 何 
复制 、 旋 转 、 裁 前 和 模糊 图 像 。 在 案例 研究 CS.5 中 ， 我们 揭 开 面纱 ， 讨 论 这 种 图 像 处 理工 
具 的 实现 方法 。 
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5.8 本章 小 结 


这 个 关键 的 章节 深入 介绍 了 Python 控制 流 结构 。 

首先 我 们 重新 讨论 了 第 2 章 介 绍 的 if 控制 流 结 构 。 我 们 描述 其 一 般 语 法 格式 : 使 用 
elif 语句 的 多 路 分 文 结 构 。 虽 然 单 分 支 和 双 分 支 结 构 定义 为 只 有 一 个 条 件 ， 一般 来 说 多 路 
条 件 结构 包含 多 个 条 件 。 如 果 条 件 不 是 相互 排斥 的 ， 则 在 多 路 if 语句 中 条 件 出 现 的 次 序 十 
分 重要 ， 必 须 注意 确保 其 顺序 满足 所 需 的 行为 。 

本 草 的 大 部 分 小 节 侧 重 于 描述 迭代 结构 的 不 同 使 用 方式 。 首 先 讨论 的 是 基本 迭代 、 计 数 
策 、 累 加 器 和 扔 套 循环 模式 。 这 些 不 仅 是 最 稼 见 的 循环 模式 ， 而 且 是 构建 更 高 级 循环 模式 的 
基础 。 衣 套 循环 模式 特别 适用 于 处 理 二 维 列表 ， 我 们 在 本 章 中 讨论 了 这 方面 内 容 。 

在 描述 更 高 级 的 迭代 模式 之 前 ， 我 们 引入 男 一 个 Python 循环 结构 : while 循环 。 它 比 
for 循环 结构 更 为 普遍 ， 可 以 用 来 实现 使 用 for 循环 难于 实现 的 循环 。 通 过 使 用 while 循 
环 结 构 ， 我 们 描述 了 序列 、 无 限 、 交 互 式 和 循环 折 半 循环 模式 。 

在 本 章 的 最 后 ， 我 们 介绍 了 男 外 几 个 迭代 控制 语句 (break、continue 和 pass),， 这 
些 语句 为 迭代 结构 和 代码 开发 提供 了 更 多 的 控制 。 

决策 和 迭代 控制 流 结构 是 用 来 描述 问题 的 算法 解决 方案 的 基本 构件 。 如 何在 解决 问题 时 
有 效 地 应 用 这 些 结构 是 计算 专业 人 员 的 基本 技能 之 一 。 人 掌握 多 路 分 文 条 件 结构 和 理解 何 时 以 
及 如 何 应 用 本 草 描 述 的 迭代 模式 是 发 展 这 些 技能 的 第 一 步 。 


5.9 ”练习 题 告 案 


5.1 在 计算 BMI 之 后 ,我们 使 用 一 个 多 路 if 语句 来 确定 输出 的 内 容 : 


def myBMI (weight, height): 
' 输出 BMI 报告 ' 
bmi = weight * 703 / height**2 
i bmi < 18.5: 
print(' 体重 过 轻 ') 
elif bmi < 25: 
print(' 正常 '，) 
else: # bmi >= 25 
print(' 体重 过 重 ') 
5.2 我们 需要 输出 2 ，2 ，2 ，…，2”( 即 对 于 所 有 1 到 之 间 的 i， 输出 2 )。 要 在 范围 1 到 n (包括 ) 
之 间 夫 代 ， 可 以 使 用 也 数 调用 range(1,， n+1): 


def powers(n): 


二 
for 1 jn ravge(l, n+1): 
print (2**i, end=' ') 


5.3 ”我们 需要 检查 相 邻 列表 值 之 间 的 差 是 否 全 部 相同 。 一 种 方法 是 检查 它们 全 部 与 前 两 个 列表 项 目 
(1[0] 和 1[1]) 之 间 的 差 是 否 相 同 。 因 此 ， 我 们 需要 检查 1[2]-1[1]、1[3]-1[2]、… 
1[n-1]-1[n-2] 是 否 都 等 于 diff = 1[1] - 100]， 其 中 冯 是 列表 1 的 大 小 。 或 者 说 ， 针 
对 1=1，2，…，1-2 (通过 迭代 range(1，1len(1)-1)), 检查 是 否 满足 1[i+1] - 1[i] = 
可 二 王 下 。 
def arithmetic(1st) : 


如 果 列 表 包 含 一 个 等 差 序列 ， 返回 True; 否则 ， 
返回 False。 ' 


3.4 


3 


5.6 


3 


3.8 
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if len(lst) < 2: # 长 度 小 于 2 的 序列 是 等 差 序列 
return True 
# 检查 相 邻 项 之 差 是 否 等 于 前 两 个 数 之 差 
diff = lst[1] - lst[0] 
for i in range(1l, len(lst)-1): 
if lst{[i+1] = last[i] 1= diff: 
return False 
return True 


我 们 需要 把 整数 1、2、3、…、n 相 乘 (累积 )。 累 积 器 res 初始 化 为 1 (乘法 的 单位 元 )。 然 后 
和 迭 代 序 列 2、3、4、…、n， 并 把 res 乘 以 序列 中 的 每 一 个 值 : 


def factorial (n): 


:返回 nl 

res = 1 

ior 1 in Fange(2, hely: 
res *= 1 


return res 


在 该 问题 中 ， 我 们 要 太 代 短语 中 的 单词 ， 并 时 加 每 个 单词 的 首 字母 。 因 此 需要 使 用 字符 串 
split() 方法 把 短语 拆 分 为 一 个 单词 列表 ， 然 后 迭代 该 列表 中 的 每 个 单词 。 我 们 将 把 每 个 单词 
的 首 字 母 添加 到 此 加 融 字 符 串 res 中 。 


def acronym(phrase): 
' 返回 输入 字符 串 短 语 的 首 字母 缩写 ， 
# 把 短语 拆 分 为 一 个 单词 列表 
words = phrase.split() 
# 累加 每 个 单词 的 首 字母 (大写 ) 
res = '"! 
for w in words: 

res = res + W[0] .upper() 

return res 


n 的 因子 包含 1 和 nn， 也 许 还 有 二 者 之 间 的 其 他 数 。 要 查找 因子 ,我 们 需要 迭代 range(1， 
n+1) 范围 里 的 所 有 整数 ， 并 检查 每 个 整数 是 否 是 对 的 因子 。 


def divisors (n) : 
' 返回 n 的 因子 的 列表 ， 
res = [] 
for i in range(1，n+l) : 
if n% i == 
res.append (i) 
return res 


我 们 将 使 用 髓 套 循环 模式 将 第 一 个 列表 中 的 每 个 整数 乘 以 第 二 个 列表 中 的 每 个 整数 。 外 部 for 
循环 将 遍历 第 一 个 列表 中 的 整数 。 然 后 ， 对 于 外 部 for 循环 中 的 每 一 个 整数 i， 内 部 for 循环 将 
迭代 第 二 个 列表 的 整数 ， 每 个 整数 乘 以 i。 乘 积 被 累积 到 一 个 列表 累加 器 中 。 


def milt(Lii, Lo: 
''! 返 回 列表 11 中 的 项 与 列表 
12 中 的 项 的 乘积 列表 ''' 
l1= [0] 
or Ti 1 
Sor 1 3m 2 
1.append (i*j) 
return 1 


正如 练习 题 的 前 述 ， 在 第 一 轮 比较 中 ， 需 要 连续 比较 位 于 索引 0 和 1、1 和 2、2 和 3、…、 直 到 
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len(lst)-2 和 1len(lst)-1l 的 项 。 这 个 可 以 通过 产生 一 个 从 0 到 1len(1lst)-1l (不 包括 ) 的 
一 系列 整数 来 实现 。 

在 第 二 轮 比 较 中 ， 我 们 可 以 在 比较 索引 len(1lst)-3 和 1len(1lst)-2 的 值 对 后 停止 ， 因 此 
第 二 轮 比较 中 的 索引 从 0 到 Ilen(1Lst)-2 (不 包括 )。 这 意味 着 我 们 应 该 使 用 外 循环 产生 上 限 值 : 
第 1 轮 比 较为 len(1lst)-1, 第 二 轮 比 较为 len(1lst)-2， 直 到 1 (最 后 一 次 时 ， 是 比较 最 前 
面 两 个 列表 项 的 值 )。 

内 循环 实现 相 邻 列表 项 的 比较 ， 直 到 索引 Ii -1 和 并 ， 如 果 顺 序 不 对 ， 则 交换 相 邻 列表 项 的 
位 置 : 
def bubblesort(1st) : 

' 把 列表 1st 按 升序 排列 ， 


for i in range(len(lst)-1, 0, -1): 
# 执行 各 轮 比较 ,每 轮 终止 在 


和 Lam(tlieat}-l, Leomtlest) -Rs i。 1 
for j in range(i): 
厅 对 于 竹林 可 二 起 、 示 aa 二 =， 化 可 家 列 
j 和 jj +l 的 项 


3 
# 交换 索引 j 和 j +1 的 项 
lub Uli] LabLTill = Totlit], Jp$14} 


我 们 使 用 散 套 循环 模式 产生 所 有 的 列 和 行 索 引 对 ， 并 添加 到 对 应 的 项 : 


def add2D(t1, t2): 
'''t1 和 tt2 是 二 维 列表 ， 行 数 和 列 数 相同 。 


add2D 把 tl[il[j] 加 上 对 应 的 上 2[i]l[j]'… 


nrows = len(t1) # 行 数 

ncols = len(t1[0]) # 列 数 

for i in range(nrows): # 对 于 每 一 行 索 引 主 
for j in range(ncols): # 对 于 每 一 列 索引 


ti[i] [i] += 2[1] [4] 


5.10 ”首先 注意 一 笔 投 资 值 翻 倍 所 需 的 年 限 与 投资 额 无 关 。 因 此 ， 我们 假设 最 初 的 投资 额 为 $100， 我 
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们 使 用 一 个 while 循环 语句 把 每 年 的 利息 累加 到 投资 x 上 。while 循环 条 件 检 查 是 否 满足 x 
< 200。 这 个 问题 的 答案 相当 于 执行 了 while 循环 多 少 次 。 要 统计 计数 ,我 们 使 用 计数 右 循 环 
模式 : 


def interest(rate): 
'"''! 返回 给 定 利率 下 一 笔 投 资 翻 倍 所 需 的 年 限 ，'' 
amount = 100 # 初始 账户 余额 
count = 0 
while amount < 200: 
# 当 投 资 没有 翻 倍 
count += 1 # 增加 1 年 
amount += amount*rate # 累加 利息 
return count 


首先 我 们 把 第 一 次 近似 值 赋值 给 prev， 第 二 次 近似 值 赋值 给 current。 因 此 while 循环 
条 件 为 : current - prev > error。 如 果 条 件 为 真 ， 则 需要 计算 prev 和 current 
的 新 值 。 变 量 current 的 值 变 成 了 prev， 新 的 current 值 则 为 previous + 1/ 
factorial(???)。 和 那么 这 个 ??? 该 是 多 少 呢 ?在 第 一 次 迭代 中 ， 它 为 2， 因 为 第 三 次 近似 值 
是 第 二 次 近似 值 加 上 1/2!。 在 下 一 次 迭代 中 ， 它 为 3， 然 后 是 4， 以 此 类 推 。 于 是 解答 如 下 : 


def approxE(error): 
' 返回 误差 在 error 范围 内 的 e 的 近似 值 ' 


prev = 1 # 第 0 次 近似 值 
cirrent = 2 # 第 1 次 近似 值 
主 壹 多 # 下 一 次 近似 值 的 索引 


while current-prev > error: 
# 当前 近似 值 和 前 一 次 近似 值 之 差 太 大 时 
# 


prev = current 当前 近似 值 变 成 前 一 次 近似 


current = prev + 1/factorial(i) # 根据 索引 并 计算 新 的 近似 值 
i += 1 # 下 一 次 近似 值 的 索引 


return current 


5.10 习题 


5.12 实现 图 数 test()， 市 一 个 整数 作为 输入 参数 ， 根 据 输 入 参数 的 值 输出 “ 正 数 ”““ 零 ”或 
“负数 ”。 
>>> test(-3) 
Negative 
>>> test (0) 
Zero 
>>> test(3) 
Positive 
5.13 阅读 习题 5.14 到 习题 5.22， 确 定 每 道 习 题 应 该 使 用 哪 种 循环 模式 。 
5.14 编写 图 数 mult3( ) ， 审 一 个 整数 列表 作为 输入 参数 ， 仅 仅 输 出 列表 中 是 3 的 倍数 的 那些 数值 ， 
每 个 值 占 一 行 。 


>>> Wt LS 和 6 ， 2 3， S$, Es 9, 5， 4， 5] ) 


GD iD 中 0 


5.15 ”实现 图 数 vowe1ls ( ) ， 市 一 个 字符 串 作 为 输入 参数 ， 输 出 字符 串 中 所 有 元 音 的 索引 。 提 示 : 元 
音 是 字符 串 'aeiouAEIOU' 中 的 字符 之 一 。 
>>> vowels('Hello WORLD') 
1 


全 
锯 


5.16 ”编写 水 数 indexes ( ) ， 市 两 个 输入 参数 : 一 个 单词 (作为 字符 串 ) 和 一 个 字符 字母 (作为 字符 
串 )， 输 出 字符 字母 在 单词 中 出 现 位 置 的 索引 。 
>>> indexes('mississippi'’, 's') 
[人 
>>> indexes('mississippi', ‘'i') 
Ls Ss Fs 
>>> indexes('mississippi', 'a') 


[] 


5.17 编写 限 数 doubles ( ) ， 市 一 个 整数 列表 作为 输入 参数 ， 输 出 列表 中 正好 是 前 一 个 数 的 两 倍 的 整 
数 ， 每 个 数 占 一 行 。 
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RN 
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人 


> doubLes tL 0 L, DS BG 6 2 5B BG 5) 
2 
6 
全 


实现 函数 four_ letter()， 带 一 个 单词 ( 即 字符 串 ) 列表 作为 输入 参数 ， 输 出 列表 中 所 有 由 
四 个 字母 组 成 的 单词 的 列表 。 

25 Eour lettoertl dog', ‘letter', Stop', 1d6orL "bus's dust']) 

上 “人 GE dust '] 

编写 一 个 图 数 inBoth ( ) ， 寓 两 个 列表 作为 输入 参数 ， 如 果 两 个 列表 包含 一 个 相同 的 项 ， 则 返 
回 True， 否 则 返回 False。 

> ot 2 

True 

编写 一 个 图 数 intersect( ) ， 带 两 个 列表 (各 列表 中 不 包括 重复 项 ) 作为 输入 参数 ， 返 回 两 个 
列表 都 包含 的 共同 值 构成 的 列表 ( 即 两 个 输入 列表 的 交集 )。 

SLS 5 1 

[3,9] 

实现 困 数 pair()， 吾 三 个 输入 参数 : 两 个 整数 列表 和 一 个 整数 n。 输 出 和 为 n 的 整数 对 (其 中 
一 个 整数 来 自 第 一 个 列表 ， 男 一 个 整数 来 自 第 二 个 列表 )。 输 出 所 有 满足 条 件 的 整数 对 。 

3 palr(t2, 3 Hs 7 

2 

4 5 

实现 果 数 pairSum( ) ， 带 两 个 输入 参数 : 一 个 值 不 重复 的 整数 列表 1st 和 一 个 整数 n。 输 出 
列表 中 所 有 和 为 n 的 整数 对 的 索引 。 

TGS 人 L7 Bs 5 B11) 

0 4 


之 5 


思考 题 


编写 函数 pay( ) ， 刘 两 个 输入 参数 : 小 时 工资 和 上 周 员工 工作 了 的 小 时 数 。 函 数 计 算 并 返回 员 
工 的 工资 。 加 班 工资 的 计算 方法 如 下 : 大 于 40 小 时 但 小 于 或 等 于 60 小 时 按 平时 小 时 薪酬 的 1.5 
倍 给 薪 ; 大 于 60 小 时 则 按 平时 小 时 薪酬 的 2 倍 给 薪 。 

>>> pay(10，35) 

350 

>>> pay (10, 45) 

475.0 

>>> pay(10, 6€1) 

720.0 


编写 函数 case( ) ， 带 一 个 字符 串 作 为 输入 参数 ， 根 据 字 符 串 是 否 为 大 写 、 小 写 或 非 英文 字母 ， 
分 别 返回 “大 写 "、“ 小 写 ”或 “未 知 ”。 

>>> case('Android') 

"Caplitalized 


>>> case('3M') 


'unknown' 


实现 函数 leap ( )， 带 一 个 年 份 作为 输入 参数 。 如 果 是 国 年 ， 则 返回 True， 否 则 返回 False。 
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(如 果 某 年 能 被 4 整除 但 不 能 被 100 整除 ， 或 者 能 被 400 整除 ， 则 该 年 是 国 年 。 例 如 ，1700、 
1800 和 1900 不 是 半年 ,但 1600 和 2000 是 国 年 。) 

>>> leap (2008) 

True 

>>> leap (1900) 

False 

>>> leap (2000) 

True 

“石头 、 剪 刀 、 布 ”是 一 种 两 个 人 玩 的 游戏 ， 每 个 人 选择 其 中 一 项 。 如 果 两 个 人 选择 相同 项 ， 则 
游戏 打 成 平 手 。 和 否则， 按 如 下 规则 决定 胜 负 

(a) 石头 胜 剪 刀 (因为 石头 能 砸 剪刀 ) 

(b) 剪刀 胜 布 〈 因 为 剪刀 能 剪 布 ) 

(c) 布 胜 石头 (因为 布 包 石头 ) 

编写 限 数 rps ( ) ， 带 两 个 参数 : 选手 1 的 选择 和 选手 2 的 选择 ('R'、'P' 或 'S')。 如 果 选 手 
1 胜 则 返回 1， 如 果 选 手 2 胜 则 返回 -1， 如 果 平 手 则 返回 0。 

So vosk Dt ?RY 
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编写 函数 letter2number ( ) ， 带 一 个 成 绩 等 级 字母 (A、B、C、D、F, 可 以 带 一 号 和 + 号 ) 
作为 输入 参数 ， 返 回 对 应 的 成 绩 数 值 。A、B、C、D 和 下 的 成 绩 数值 分 别 为 4、3、2、1、0。+ 
号 增加 0.3，- 号 减少 0.3。 

>>> letter2number('A-') 

+ 

>>> letter2number('B+') 

“0 

>>> letter2number('D') 

6 

编写 函数 geometric ( ) ， 带 一 个 整数 列表 作为 输入 参数 ， 如 果 列 表 中 整数 构成 几何 序列 (等 比 
数列 )， 则 返回 True。 一 个 序列 a6, ai, 4 a3, ds、 和 any rl, 当 ai/ao, ayai, aya,, as 
ds3s ""'， :| 都 相等 时 ， 则 该 序列 为 几何 序列 。 

>>> geometric([2, 4, 8, 16, 32, 64, 128, 256]) 

True 

>>> geometric([2, 4, 6, 8]) 

False 

编写 函数 lastfirst( )， 带 一 个 字符 串 (格式 为 < 姓 ， 名 >) 列表 作为 输入 参数 ， 返 回 如 下 两 
个 列表 : 

(a) 一 个 包含 所 有 名 的 列表 

(b) 一 个 包含 所 有 姓 的 列表 

>>> "Lastfirst(['Gerber, Len', ‘Fox, Kate's Dunr, Bob',)) 

下 Kate", 'Bob']， ['Gerber ' ， EO Dunn']] 

编写 消 数 many ( )， 带 一 个 当前 目录 中 的 文件 名 (字符 串 ) 作为 输入 参数 ， 输 出 长 度 分 别 为 1、 
2、3 和 4 的 单词 的 个 数 。 使 用 文件 sample .txt 测试 曙 数 。 


136 党 了 间 


>>> many('sample.txt') 
Words of length 1 : 2 
Words of length 2 : 5 
Words of length 3 : 1 
Words of length 4 : 1 


5.31 编写 一 个 函数 subsetsum( ) ， 带 两 个 输入 参数 : 一 个 正 数列 表 和 一 个 正 数 target。 如 果 列 
表 中 存在 三 个 数 累加 和 等 于 target， 则 返回 True。 例 如 ， 如 果 输 入 列表 为 [5，4， 10， 
20，15，19]，target 为 38， 则 返回 True。 因 为 4+ 15 +19 = 38。 但 是 ， 对 于 同样 的 输入 
列表 但 target 为 10， 则 返回 False。 因 为 列表 中 任何 3 个 数 的 累加 和 都 不 等 于 10。 


>>> subsetSum([5, 4, 10, 20, 15, 19] ，38) 
True 
33> Bubsetoum( [BbB, 4 10 20; 15; 19}, 10) 
False 


5.32 ”实现 函数 £ib()， 带 一 个 非 负 整数 n 作为 输入 参数 ， 返 回 第 n 个 斐 波 那 契 数 。 


33> DO 
1 

>>% fib(4) 
5 

>>> fib(8) 
34 


5.33 ”实现 一 个 函数 mystery( ) ， 带 一 个 正 整数 对 作为 输入 参数 并 回答 下 列 问 题 : n 折 半 多 少 次 (使 
用 整数 除法 ) 后 为 1? 返回 折 半 的 次 数 。 


>>> mystery(4) 
2 
>>> mystery(11) 
3 
>>> mystery(25) 
4 


5.34 ”编写 一 个 函数 statement ()， 带 一 个 浮 点 数列 表 作 为 输入 参数 ， 正 数 代 表 问 银行 账户 存款 ， 
负数 代表 从 银行 账户 取款 。 要 求 函 数 返回 一 个 包括 两 个 浮 点 数 的 列表 : 第 一 个 数 是 存 球 总 和 ， 
第 二 个 数 (负数 ) 是 取 球 总 和 。 


> statement ([30.95, =15.67, 45.56, =55.00, 43.78j]» 
L120..29.,. =F0.67] 


5.35 ”实现 函数 pixels()， 带 一 个 二 维 非 负 整数 列表 (表示 一 幅 图 像 的 像素 值 ) 作为 输入 参数 ， 返 
回 其 中 正 数 项 的 个 数 ( 即 非 全 黑 的 像素 点 个 数 )。 要 求 函 数 可 以 处 理 任何 大 小 的 二 维 列表 。 


wo 1 [LD 6 0 加 [3 0 罗 ， 呈 5 23， 1423 9 3 

>>> pixels(]) 

5 

Sw 1 3 [lt23, De, 255], [34, 0 Ds L233, L239; 胡 。 3 0 允 ] 
>>> pixels(]) 

前 


5$.36 “实现 函数 prime( ) ， 带 一 个 正 整 数 作为 输入 参数 ， 如 果 是 素数， 则 返回 True， 否 则 返回 False。 


>>> prime(2) 
True 
>>> prime(17) 
True 
>>> prime(21) 
False 


0 
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编写 函数 mss1() (最 大 和 子 列表 )， 带 一 个 整数 列表 作为 输入 参数 。 要 求 图 数 计 算 并 返回 输入 
列表 中 的 最 大 和 子 列表 之 和 。 最 大 和 子 列表 是 输入 列表 的 子 列表 (切片 )， 其 各 项 之 和 最 大 。 空 
列表 的 和 定义 为 0。 例如 ， 对 于 下 列 列表 : 

Ld = = bb, 2 ,7,2 <6 | 

其 最 大 和 子 列表 为 [5, -2, 7, 7, 2]， 其 各 项 之 和 为 19。 


人 
>>> mss1(1) 


19 

>>> mssl([3,4,5]) 

12 

>>> mssl([-2,-3,-5]) 
0 


在 最 后 一 个 例子 中 ， 最 大 和 子 列表 为 空子 列表 ， 因 为 所 有 的 列表 项 都 是 负数 。 

编写 限 数 collatz()， 市 一 个 正 整 数 x 作为 输入 参数 ， 输 出 从 x 开始 的 Collatz 序列 。Collatz 
序列 按 如 下 规则 根据 序列 中 前 一 个 x 重复 计算 下 一 个 xx: 

X/2 Xx 为 偶数 时 

3x+1 X 为 奇数 时 

要 求 当 序列 达到 数值 1 时 终止 。 注 意 : 是 否 每 一 个 正 整数 的 Collatz 序列 总 是 结束 为 1 是 悬 而 未 
决 的 问题 。 

>>> CGOL1atzZ010O) 

10 

5 

16 

8 

4 


2 
1 


编写 函数 exclamation()， 带 一 个 字符 串 作为 输入 参数 ， 返 回 修改 后 的 字符 串 : 每 个 元 音字 
母 符 换 为 4 个 连续 的 相同 元 音 ， 最 后 增加 一 个 感叹 号 (!)。 

>>> exclamation('argh') 

“aaaarghl! 

>>> exclamation('hello') 


!'heeeelloooo!'! 


常数 区 是 一 个 无 理 数 ， 甚 近似值 为 3.1415928…。 的 准确 值 等 于 如 下 无 穷 数 列 之 和 : 
r=4/1-4/3+4/5-4/7+ 4/9—4/11 +… 

我 们 可 以 通过 计算 该 无 穷 数列 前 几 项 之 和 得 到 7 的 一 个 很 好 的 近似 。 编 写 一 个 孙 数 
approxPi()， 带 一 个 浮 点 值 error 作为 输入 参数 。 逐 项 计算 无 穷 数 列 的 和 ， 直 到 当前 和 和 前 
一 次 和 ( 少 一 项 ) 之 差 小 于 或 等 于 error， 来 求 得 x 的 误差 在 error 之 内 的 近似 值 。 函 数 应 该 
返回 新 的 和 。 
>>> approxPi(0.01) 

3.1465677471829556 

>>> approxPi(0.0000001) 

3.1415927035898146 

系数 为 ao，a，qaa，d，…，w, 的 于 次 多 项 式 是 如 下 的 一 个 函数 : 
p(x)=a0 taxtax +ay*x 十 十 QU 水 


国 数 可 以 针对 不 同 的 x 求 值 。 例 如 ， 如 果 PpooO = 1+2x+ 关 则 PC2)=1+2*2+2=9。 如 
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5.45 
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果 p(x)=1+x +x, 则 p(2)=2, p(3)=91。 

编写 一 个 函数 poly( ) ， 带 两 个 输入 参数 : 一 个 多 项 式 p(x) 的 系数 ao, al，a;, a;3，…,， a, 
的 列表 和 一 个 数值 x。 要 求 限 数 返 回 p(x)， 即 多 项 式 对 x 的 求 值 结果 。 注 意 下 面 用 法 是 上 述 三 个 
例子 的 运行 结果 。 
> po 2 4 ， 荔 
9 
PR DO 9 1}, 2 
21 
Sy paly( li 0 LV 1 
91 
实现 阴 数 primeFac()， 币 一 个 正 整 数 n 作为 输入 参数 ， 返 回 一 个 包含 n 的 所 有 紊 因子 分 解 的 
约 数 的 列表 。( 正 整数 球 的 素 因 子 分 解 是 乘积 为 于 的 所 有 素数 的 列表 。) 
>>> primeFac(5) 
[5] 
>>> primeFac(72) 
ne PE 
编写 明 数 evenrow( ) ， 带 一 个 二 维 整数 列表 作为 输入 参数 。 如 果 二 维 整数 列表 每 一 行 之 和 均 为 
偶数 ， 则 返回 True; 否则 返回 False ( 即 有 的 行 之 和 为 奇数 )。 
>>> evenrow([[1, 3], [2, 4], [0, 6]]) 
True 
>>% Byenrow(l [i SB 2 [3 4 TI: (Ws 6 2]]1» 
True 
> 
False 
数字 0, 1, 2, 3,…, 9 的 替代 密码 是 把 0, 1, 2, 3, …, 9 中 的 每 一 个 数字 替换 为 0, 1, 2, 3，…， 
9 中 的 男 一 个 数字 。 它 可 以 表示 为 一 个 10 位 数 的 字符 时 ， 捐 定 0 1 2，3， "9 中 的 每 个 数 
字 如 何 被 替换 。 例 如 ，10 位 字符 串 “3941068257” 指 定 了 一 个 替代 密码 ， 其 中 数字 0 被 替换 为 
数字 3，1 被 替换 为 9 ，2 被 替换 为 4， 等 等 。 若 要 加 密 一 个 非 负 整数 ， 请 用 加 密 密 钥 指定 的 数字 
奉 换 其 每 个 数字 。 

实现 函数 encrypt( ) ， 带 两 个 输入 参数 : 一 个 10 位 字符 串 密 钥 和 一 个 数字 字符 串 ( 即 要 
加 密 的 明文 )， 返 回 明文 的 加 密 密 文 。 


>>> encrypt('3941068257', '132') 
"gt4' 
>>> encrypt('3941068257', '111') 
1999， 


呆 数 avgavg ( ) 带 一 个 列表 作为 输入 参数 ， 列 表 各 项 是 由 三 个 数组 成 的 列表 。 每 个 三 个 数列 表 
代表 特定 学 生 某 门 课 程 获得 的 三 次 成 绩 。 例 如 ， 某 门 课程 四 名 学 生成 绩 的 输入 列表 如 下 : 
[[95 ,92,86], [66,75,54], [89, 72,100],[34,0,0]] 

要 求 函 数 avgavg( ) 在 屏幕 上 输出 两 行内 容 。 第 一 行为 包含 每 个 学 生平 均 成 绩 的 列表 。 第 
二 行 仅 包含 一 个 数值 : 班级 平均 成 绩 ， 即 所 有 学 生平 均 成 绩 的 平均 值 。 
>>> avgavg([[95, 92, 86], [66, 75, 54],[89, 72, 100], [34, 0,，0]]) 
[91.0; 65.0; 87.0。， 坟 ,333333333333334 
63.5833333333 
序列 中 的 逆序 是 一 对 反 序 的 条 目 。 例 如 ， 在 字符 串 “RABBFHDL” 中 ， 因 为 字符 下 出 现在 D 之 
前 ， 因 此 F 和 D 构成 了 逆序 。 字 符 H 和 D 也 是 如 此 。 序 列 中 的 逆序 数量 〈《 即 无 序 对 的 数量 ) 是 
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序列 无 序 状 态 的 一 种 度量 。 ”ARABBFHDL ”中 逆序 的 总 数 是 2。 实现 限 数 inversions()， 囊 一 
个 由 A 到 Z 中 大 写字 母 组 成 的 序列 ( 即 字符 串 ) 作为 输入 参数 ， 返 回 序列 中 的 逆序 数 。 

>>> inversions('ABBFHDL') 

2 

>>> inversions('ABCD') 

0 

>>> inversions('DCBA') 

6 

编写 困 数 d2x( ) ， 和 市 两 个 输入 参数 : 一 个 非 负 整数 n (标准 十 进 制 表 示 ) 和 一 个 2 到 9 之 间 的 整 
数 x， 返 回 n 的 x 进 制 表示 的 数字 字符 串 。 

323% 210 2 

11010， 

> 2 

1101， 

>>> 了 2xktO， 8) 

io， 

假设 1ist1 和 1ist2 是 两 个 整数 列表 。 如 果 1ist1 中 的 元 素 按 相同 顺序 出 现在 1ist2 中 
(但 不 一 定 要 连续 )， 则 我 们 称 List1l 是 1ist2 的 子 列表 。 例 如 ， 如 果 1istl 定义 为 


Pi, 3 00 
list2 定义 为 : 
F260, 415. 30 0 0] 


则 1istl 是 1ist2 的 子 列表 ， 因 为 1istl 的 数值 (15、1 和 100 ) 包含 在 1ist2 并 且 保 持 相 
同 顺序 。 然而 ， 列表 : 


[15; 50, ‘20] 


不 是 1ist2 的 子 列表 。 
实现 函数 sublist()， 带 两 个 输入 参数 : 列表 List1 和 1List2。 如 果 1List1l 是 1ist2 
的 子 列表 ， 返 回 True; 否则 返回 False。 
> BDLLSSCIIS. A 2001, [99 465. 3 DO 
True 
Sp Sublisttlis, S50 20)s [320 15 S00, 5§80,. 二。 1004) 
False 
Heron 方法 是 古 希 腊 人 用 于 计算 一 个 数 n 的 平方 根 的 方法 。 该 方法 生产 一 系列 值 不 断 允 近 Vn。 
序列 中 的 第 一 个 值 是 一 个 任意 的 猜测 值 ， 其 他 值 根据 前 一 个 值 prev 计算 获得 ， 计 算 公 式 如 下 : 





] 
一 (PEevV 十 ) 
2 prev 


编写 函数 heron( ) ， 带 两 个 数值 输入 参数 : n 和 error。 函 数 从 Vn 的 初始 猪 测 值 1.0 开始 ， 
重复 计算 其 更 好 的 近似 值 ， 直 到 两 次 相 邻 的 近似 值 之 差 ( 更 准确 地 说 ， 差 的 绝对 值 ) 小 于 或 等 于 
error, 
>>> heron(4.0, 0.5) 
ZsQ5 


>»>3 heron(40, 0.1) 
2.000609756097561 
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容 售 和 随机 性 





本 章 重 点 讨论 Python 内 置 的 其 他 容 需 类 。 虽 然 列 表 是 非常 实用 的 通用 容 角 ， 但 有 些 情 
况 下 使 用 起 来 会 笨拙 上 且 效 率 不 高 。 因 此 ，Python 提供 了 其 他 内 置 的 容 需 类 。 

在 字典 容 硕 中 ， 存 储 在 容 需 中 的 值 可 以 通过 被 称 为 键 (keys) 的 用 户 指 定 索引 进行 索引 。 
字典 有 很 多 诸如 计数 的 用 途 。 字 典 和 列表 容 需 一 样 ， 也 是 通用 容 锅 。 除 了 字典 ， 我 们 还 将 介 
绍 内 置 容 肯 类 set 的 用 法 。 

我 们 将 再 次 讨论 字符 串 ， 把 字符 串 作为 字符 的 容 髓 。 在 当今 互联 的 世界 中 ， 文 本 在 一 个 
地 方 创 建 ， 然 后 在 另 一 个 地 方 阅读 ， 因 此 计算 机 必须 能 够 为 不 同 的 写作 系统 处 理 字 符 编 码 和 
字符 解码 。 我 们 引入 Unicode 作为 字符 编码 的 当前 标准 。 

为 了 介绍 一 系列 全 新 的 问题 和 应 用 ,包括 计算 机 游戏 ,我们 在 这 一 章 结 束 时 讨论 如 何 生 
成 “随机 ”数字 。 


6.1 字典 
我 们 通过 介绍 非常 重要 的 字典 容器 内 置 类 型 来 开始 这 一 章 的 内 容 。 


6.1.1 用 户 自 定义 索引 作为 字典 的 动机 


假设 我 们 需要 为 50 000 名 雇员 的 公司 存储 员工 记录 。 理 想 情况 下 ， 我 们 希望 能 够 使 用 
员工 的 社会 安全 号 码 (SSN) 或 ID 号码 来 访问 每 个 员工 的 记录 。 类 似 如 下 方式 : 

>>> employee [987654321] 

La | 

>>> employee[864209753] 

[('Anna's Karenina'] 

>>> employee[100010010] 

['Hans', "Castorp'] 

在 名 为 employee 的 容器 的 索引 位 置 987654321 存储 着 SSN 987-65-4321 的 员工 
的 名 和 姓 : Yu Tsun。 名 和 姓 保 存在 一 个 列表 中 ， 列 表 还 可 以 包含 其 他 信息 (例如 ， 地 
址 、 出 生日 期 、 职 位 ， 等 等 )。 索 引 位 置 864209753 和 100010010 分 别 存 储 着 [ 'Anna'， 
Karenina'] 和 ['Hans',，'Castorp']。 和 总 之 ， 索 引 位 置 了 中 存储 着 SSN 为 i 的 记录 
(名 和 姓 ) 。 

如 果 employee 是 一 个 列表 ， 则 必须 是 一 个 非常 大 的 列表 。 至 少 要 比 最 大 的 员工 SSN 
大 。 由 于 SSN 是 9 位 数 ， 因 此 employee 的 大 小 至 少 为 1 000 000 000。 如 此 巨大 ， 即 使 系 
统 支 持 如 此 巨大 的 列表 ， 结 果 也 是 巨大 的 浪费 : 列表 的 大 部 分 都 为 空 ， 只 使 用 了 50 000 个 
列表 位 置 。 列 表 还 存在 其 他 诸多 问题 ，SSN 实际 上 并 不 是 整数 值 ， 通 常 表示 为 带 中 划 线 ( 例 
如 ，987-65-4321 )， 也 可 能 从 0 开始 (例如 ，012-34-5678 ) 。 类 似 987-65-4321 和 012-34- 
5678 的 值 可 以 更 好 地 表示 为 字符 串 : '012-34-5678' 和 '987-65-4321'。 

问题 在 于 列表 项 是 要 使 用 一 个 表示 集合 中 项 的 位 置 的 整数 索引 来 访问 。 人 然而 我 们 期 望 如 
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此 不 同 : 我 们 希望 使 用 “用 户 定义 的 索引 ”( 如 '012-34-5678' 或 '987-65-4321') 来 访问 项 。 如 
图 6-1 所 示 。 


'987-65-4321' '864-20-9753' '100-01-0010' 





ne | 全 二 RE ER St 
['Anna','Karenina'] | Lo ETS 5 ['Hans','Castorp'] 
Ten ds se Simp 


图 6-1 字典 的 动机 。 字 典 是 存储 项 的 容 右 ， 可 以 使 用 “用 户 自 定义 ”索引 访问 
Python 包括 一 个 内 置 的 称 为 dictionary (字典 ) 的 容 需 类 型 ， 人 允许 用 户 使 用 “用 户 自 和 定 


>>> employee = { 


'864-20-9753': ['Anna’ , IKarenina'] ， 
"QB7=65-4324'7 LYu',. *Twan'j, 
"400-01-0010"» ['Hans', Castorp']} 


赋值 语句 分 为 多 行书 写 是 为 了 强调 “索引 ”'864-20-9753' 对 应 于 ['Anna',， 
'Karenina']， 索引 '987-65-4321' 对 应 于 ['Yu', 'Tsun'] ， 等 等 。 让 我 们 检查 一 下 
employee 的 行为 是 否 符 合 预期 : 


>>> employee['987-65-4321 '] 
on 
>>> employeel'864-20-9753'] 


['Anna', 'Karenina'] 


子 典 employee 与 列表 的 区 别 在 于 : 字典 中 的 项 使 用 用 户 自 定义 的 “索引 ”( 而 不 是 表 
示 项 在 容 带 中 的 位 置 的 索引 ) 来 访问 。 接 下 来 将 详细 讨论 。 


6.1.2 字典 类 属性 


与 1ist 和 str 一 样 ，Python 字典 类 型 (名称 为 aict) 也 是 一 个 容器 类 型 。 字 典 包 含 
(key，value) (( 键 , 值 )) 对 。 字 典 对 象 的 通用 表达 式 格 式 如 下 : 

{< 

这 个 表达 式 定 义 了 一 个 包含 i 个 “ 键 : 值 ”对 的 字典 。 键 和 值 都 是 对 象 。 键 是 用 于 访问 
值 的 “索引 ”。 因 此 ， 在 我 们 的 字典 employee 中 , '100-01-0010' 是 键 , 而 ['Hans'， 
Castorp"] 是 值 。 

字典 表达 式 中 的 “( 键 , 值 )” 对 包括 在 花 括号 (这 一 点 不 同 于 列表 ， 列 表 使 用 方 插 号 
[]) 中 ,并且 使 用 逗号 分 隔 。 每 个 “( 键 , 值 )” 对 中 的 键 和 值 使 用 冒号 (:) 分 隔 ， 键 位 于 冒 
号 左 侧 ， 值 则 位 于 冒号 在 侧 。 键 可 以 是 任何 不 可 变 类 型 。 因 此 数值 和 字符 串 对 象 可 以 用 作 
键 ， 而 列表 类 型 则 不 能 。 信 可 以 是 任何 类 型 。 

我 们 常常 说 键 映射 到 值 ， 或 者 键 是 值 的 索引 。 这 是 因为 字典 可 以 看 作 是 从 键 到 值 
的 映射 ， 所 以 字典 也 通常 被 称 为 映射 (map)。 例 如 ， 下 面 是 一 个 字典 ， 把 星期 名 称 缩 
与 'Mo'、'Tu'、'We'、'Th' ( 键 ) 映射 到 对 应 的 星期 名 称 ( 值 ) 'Monday'、'Tuesday'、 
'Wednesday'、'Thursday': 


>>> days = {'Mo':'Monday', 'Tu':'Tuesday', 'We':'Wednesday', 
"Th's "Thursday'} 


变量 days 指 回 一 个 字典 ， 如 图 6-2 所 示 。 字 典 包 含 4 个 ( 键 , 值 ) 对 。( 键 ， 值 ) 对 


《¢ 


'Mo' : "Monday ' ”的 键 为 'Mo' ， 什 为 'Monday'; ( 键 , 值 ) 对 “'Tu':"'Tuesday'” 
的 键 为 'Tu' ， 值 为 'Tuesday'; 等 等 。 
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图 6-2 字典 days。 字 典 把 字符 串 键 'Mo' 、'Tu' 、'We' 、'Th' 映射 到 字符 串 值 ' Monday ' 、 
Tuesday' ， 等 等 
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字典 中 的 值 通过 键 (而 不 是 偏 移 ) 来 访问 。 要 访问 字典 days 中 的 值 'Wednesday ' ， 
可 以 使 用 键 We ' 


>>> days['We'] 
WednesdaVy 


但 不 能 使 用 索引 2 来 访问 : 

>>> days [2] 

Traceback (most recent call last): 

File "<pyshell#27>", line 1, in <module> 
days [2] 

KeyError: 2 

KeyError 异常 表示 我 们 使 用 了 一 个 非法 的 键 ， 在 上 例 中 并 未 定义 。 

字典 中 的 ( 键 ， 值 ) 是 无 序 的 ， 因 此 不 能 做 任何 顺序 假设 。 例 如 ， 我 们 可 以 定义 字典 a 
如 下 : 

Sb "eld 


然而 ， 求 值 a 时 ,结果 不 一 定 是 定义 中 的 ( 键 , 值 ) 对 顺序 


4 


和 列表 一 样 ， 字 上 典 也 是 可 变 类 型 。 可 以 修改 字典 以 包括 一 个 新 的 ( 键 , 值 ) 对 : 


>>> days['Fr'] = 'friday' 

>>> days 

i Monday', "TE's TUesday!, 
We': Wednesday '， TIh : 'Thursday'} 


这 意味 着 字典 的 大 小 是 动态 的 。 也 可 以 修改 字典 ,使 得 既 存 的 键 指 癌 一 个 新 的 值 : 


>>> days['Fr'] = "Friday’ 

>>> days 

{Fe "Friday',, “Mo': "NMonday'., 'Tu'® "Tuesday”;, 

"We': ‘Wednesday'’', 'Th': 'Thursday '} 
使 用 默认 的 dict( ) 构造 也 数 可 以 定义 一 个 空 的 字典 ， 也 可 以 采用 如 下 简单 方式 : 
SS 过 = 


i 编写 一 个 函数 birthstate()， 市 一 个 最 近 几 届 美 国 总 统 的 姓名 (字符 串 ) 
作为 输入 参数 ， 返 回 该 总 统 的 出 生 所 在 州 。 请 使 用 如 下 字典 保存 最 近 几 届 美 国 总 统 出 生 所 在 州 
的 信息 : 
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{'Barack Hussein Obama II':'Hawaii', 
'George Walker Bush':'Connecticut', 

William Jefferson Clinton':'Arkansas’', 
"George Herbert Walker Bush : Massachussetts’', 
'Ronald Wilson Reagan': 'lllinois', 


'James Earl Carter, Jr'> iGoorgla’} 


>>> birthState('Ronald Wilson Reagan') 


1 


6.1.3 EW 


典 类 支持 一 些 列表 类 支持 的 运算 符 。 如 前 所 述 ， 可 以 使 用 索引 运算 符 ( []) 通过 把 键 
当 作 索引 来 访问 入 


>>> ayelL'Pr') 


‘Friday 
还 可 以 使 用 索引 运算 符 来 更 改 字 典 中 对 应 键 的 值 ， 或 增加 新 的 ( 键 , 值 ) 对 : 
>>> days 


Trphr's "Friday, "M's Honday, Tus Tauuday’ 


‘We': 'Wednesday', 'Th': 'Thursday'} 


>>> days['Sa'] = a 

>>> days 

和 Friday” ss "Mos "Monday™s "lu'S luesday 5 
We ss "Wedrmiesday ,s,s “Th's "Fhursday Ss SH » a 


使 用 len 也 数 ， 可 以 获取 字典 的 长 度 ( 即 字典 中 ( 键 , 值 ) 对 的 个 数 ): 


>>> len(days) 
6 


使 用 in 和 not 运算 符 ， 可 以 判断 一 个 对 象 是 否 是 字典 的 一 个 键 : 


>>> FT in days 


True 

>>> 1Su' in days 
False 

>>> 'Su' not in days 
True 


表 6-1 列举 了 可 以 用 于 字典 的 大 干 运算 从。 
表 6-1 类 dict 的 运算 符 。 表 中 列举 了 常用 的 字典 运算 符 的 用 法 和 说 明 





kind 如 果 k 是 字典 d 中 的 一 个 键 ， 则 返回 True， 否 则 返回 False 
knotin d 如 果 k 是 字典 d 中 的 一 个 键 ， 则 返回 False， 否 则 返回 True 
d[k] | 返回 字典 d 中 对 应 键 k 的 什 


len(d) | 字典 d 中 ( 键 ， 值 ) 对 的 个 数 


有 些 运算 符 1ist 类 支持 但 dict 类 不 支持 。 例 如 ， 不 能 使 用 索引 运算 符 [] 获取 字典 的 
切片 。 这 是 有 道理 的 : 切片 意味 着 顺序， 但 是 字典 并 不 存在 顺序 。 其 他 不 支持 的 运算 符 包括 
+ 和 * 等 。 


实现 函数 rlookup()， 提 供电 话 簿 的 反 向 查找 功能 。 函 数 带 一 个 表示 电话 


答 的 字典 作为 输入 和 参数。 在 字典 中 ,电话 号 码 ( 键 ) 映射 到 个 人 信息 ( 值 )。 函 数 应 该 提供 一 
个 简单 的 用 户 界面 ， 允 许 用 户 输 入 一 个 电话 号 码 ， 获 取 关 联 该 号 码 的 个 人 的 名 和 姓 。 


>>> rphonebook = {'(123)456-78-90':['Anna','Karenina'], 
ooiyjaoe- B60=78'3 LY "TH, 
(301)908=76-54'3['Hars', "Castorp']} 
>>> rlookup(rphonebook) 
请 按 如 下 格式 输入 电话 号 码 (XXX)XXX-XX-XxX: (123)456-78-90 
("nna*:, "Karodnina') 
请 按 如 下 格式 输入 电话 号 码 (XXX)XXX-XX-XX: (453)454-55-00 
你 输入 的 电话 号 码 不 存在 。 
请 按 如 下 格式 输入 电话 号 码 (XXX) XXX-XX-XX: 


6.1.4 字典 方法 
虽然 list 和 dict 类 共用 不 少 的 运算 符 ， 但 共用 的 方法 却 只 有 一 个 : pop( ) 。 这 个 方 
法 市 一 个 键 ， 如 果 该 键 在 字典 中 存在 ， 则 从 字典 中 移 除 关联 的 ( 键 , 值 ) 对 ， 并 返回 值 : 


>>> days 

UB's rly’, Moe"s Monday's "T's Tuosday'; 
IWe' ‘Wednesday', Th 'Thursday', ‘Sa': 'Sat'} 

> days, popl'Tu!) 

“Tuesday' 

>>> days. BOp CFr') 

Ld 

>>> days 

:Mos Monday', We: Wednesday", ‘Th “Thtireday', 
'Sa': 'Sat'} 


接 下 来 介绍 其 他 的 字典 方法 。 当 字典 al 使 用 字典 da2 作 为 输入 参数 调用 方法 
update() 时 ，d2 中 的 所 有 ( 键 ， 值 ) 对 将 沃 加 到 al 中 ， 如 有 果 存 在 相同 的 键 ， 则 覆盖 dl 
中 的 ( 键 , 值 ) 对 。 例 如 ， 假 设 一 个 字典 包含 了 我 们 喜欢 的 日 子 : 


>>> favorites = {Th "Thaday', I'Fr's'Friday', "Sa''Saturday'} 
我 们 可 以 把 这 些 日 子 添加 到 days 字典 : 


>>> days.update(favorites) 
>>> days 
本 “要 共生 ‘Friday', Mo: ‘Monday’', We TednesQay ， 


Ps 


[和 "Saturday '} 


( 键 ， 值 ) 对 “'Fr':'Friday'” 被 添加 到 adays 字 ~ 典 中 了 。( 键 ， 值 ) 对 “'Sa': 
'Saturday'” 符 换 了 字典 days 中 原来 的 “'sa':'Sat'”。 注 意 , ( 键 ， 值 ) 对 
“'Th':'Thursday' ”在 字典 中 只 能 存在 一 个 版 本 。 

几 个 特别 有 用 的 字典 方法 是 : keys()、values() 和 items()， 它 们 分 别 返 回 字 典 
中 的 键 、 什 和 ( 键 , 值 ) 对 。 为 了 描述 这 些 方法 的 用 法 ， 我们 使 用 如 下 定义 的 字典 days : 


>>> days 
{Fr': IFEriday™”, “Mo: "Monday ， "We : “Wednesday ， 
‘Th "THireday’'s Sa': Saturday's 


方法 keys ( ) 返回 字典 中 的 键 : 
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>>> keys = days.keys() 
>>> keys 
dict kevyel[ Fr Me, Wee's "Th" "sal 


方法 keys ( ) 返回 的 容 需 对 象 并 不 是 列表 ， 让 我 们 检查 其 类 型 : 


>>> type(days .KeySs() ) 
<class 'dict_keys'> 


好 吧 ， 这 是 一 种 我 们 没有 见 到 的 类 型 。 那 么 ,我 们 是 否 必 须 学 习 关 于 这 种 新 类 型 的 一 切 知 识 
呢 ? 此 时 ， 并 不 需要 。 我 们 仅仅 需要 了 解 其 用 法 即 可 。 那 么 ， 方 法 keys ( ) 返回 的 对 象 该 
如 何 使 用 呢 ? 其 常用 于 迭 代 字 由 中 的 键 ， 例 如 


>>> for key in days.keys(): 
Print(key，end=' ') 


Fr Mo We Th Sa 


因此 ,类 dict keys 文 持 迭代 。 事 实 上 ， 当 我 们 迭代 一 个 字典 时 ， 例 如 : 


>>> for key in days: 
print (Key, end=' ') 


Fr Mo We Th Sa 


Python 解释 天 在 执行 之 前 ， 把 语句 for key in days 翻译 成 语句 for key in 
days.keys( )。 

表 6-2 列举 了 一 些 字 典 类 支持 的 常用 方法 。 像 往常 一 样 ， 可 以 通过 查看 联机 文档 或 通过 
在 解释 天 中 键入 如 下 命令 来 了 解 更 多 信息 : 


>>> help(dict) 


表 6-2 类 dict 的 方法 。 表 中 列举 了 字典 类 的 一 些 常用 方法 。d 表示 一 个 字典 





d.items( ) 返回 字典 da 中 的 作为 元 组 的 ( 键 ， 值 ) 对 的 视图 
d.get(k) | 返回 键 k 的 值 ， 等 价 于 d[k] 

d.keys() | 返回 a 的 键 的 视图 

d.pop(k) | 从 a 中 移 除 键 k 对 应 的 ( 键 ， 值 ) 对 ， 并 返回 什 
d.upaate(d2) | 把 字典 a2 中 的 ( 键 , 值 ) 对 添加 到 a 
d.values() 返回 da 的 值 的 视图 





表 6-2 中 的 字典 方法 values() 和 items() 同样 返回 可 壕 代 的 对 象 。 方 法 values() 
常用 于 和 迭 失 代 字 上 典 中 的 值 : 


>>> for value in days.values() : 
print(value, end=', ') 


Friday, Monday, Wednesday, Thursday, Saturday, 


方法 items ( ) 返回 包含 元 组 (每 个 ( 键 , 值 ) 对 作为 一 个 元 组 ) 的 容器 : 


>>> days.items() 
dict_items([('We', 'Wednesday'), ('Mo', 'Monday'), 
人 IThursday ') ， C1 !'Tuesda 了 二 


这 个 方法 篆 用 于 友人 代 字典 的 ( 键 ,， 值 ) 对 : 
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>>> for item in days.items() : 
print(item, end='; ') 


(Pr, "Friday”)s UMo", Monday Ds We ‘Wednesday 3 
CT 'Thursday '); Coa "gaviurdasy! ys 


网 
由] 


知识 拓展 : 视 象 
方法 keys()、values() 和 items() 返回 的 对 象 被 称 为 视图 对 象 。 视 图 对 象 分 别 
为 字典 的 键 、 值 和 ( 键 ， 值 ) 对 提供 动态 视图 。 这 就 意味 着 ， 当 字典 改变 时 ， 视 图 会 跟着 
改变 。 
例如 ， 假 如 我 们 定义 字典 days 和 视图 keys 如 下 : 


>>> days 

{'Fr': 'Friday', 'Mo': 'Monday', 'We': 'Wednesday '， 
TR Td "Sas "Satturduy"} 

>>> keys = days.keys() 

>>> keys 

dicth joyut lL Pe Mo's "We Ths “Se 


变量 keys 指向 字典 days 的 键 的 一 个 视图 。 现 在 让 我 们 删除 字典 days 的 一 个 键 
(以 及 关联 的 值 ): 


>>> del(days['Mo']) 


>>> days 
A'Fr'® Eriday 'We': ， Wednesday' yy "Th': ‘Thursday', 
Sar 'Saturday'} 
注意 视图 keys 随 之 改变 : 
>>> keys 


CE TY 


keys() 、values() 和 items() 返回 的 容器 对 象 的 类 型 支持 各 种 类 似 集合 的 操作 ， 
例如 集合 的 并 集 和 集合 的 交集 。 这 些 操作 允许 用 户 合并 两 个 字典 的 键 或 者 查找 两 个 字典 共同 
的 值 。 我 们 将 在 第 6.2 节 讨 论 内 置 类 型 set 时 再 详细 讨论 这 些 操作 。 


6.1.5 ”字典 作为 多 路 分 支 if 语句 的 替代 方法 

在 本 节 开 始 介绍 字典 时 ， 我 们 的 动机 是 需要 一 个 具有 用 户 自 定义 索引 的 容器 。 我 们 现在 
展示 字典 的 另 一 种 用 法 。 

假如 我 们 希望 开发 一 个 小 的 函数 (名 为 complete( ) )， 带 一 个 输入 参数 : 星期 名 的 缩写 
(例如 'Tu' )。 返 回 对 应 的 星期 名 称 。 例 如 ， 如 果 输 入 为 'Tu' ， 则 结果 返回 'Tuesday ' : 


>>> complete('Tu') 


'Tuesday ' 
一 种 实现 该 函数 的 方法 是 使 用 多 路 分 文 ifE 语句 : 
def complete(abbreviation): 


' 返回 星期 名 缩写 对 应 的 星期 名 称 ， 


if abbreviation == 'Mo': 
return 'Monday' 

elif abbreviation == 'Tu': 
return 'Tuesday' 
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dll 5n 


else: # 缩写 一 定 是 Ju 
return 'Sunday 
我 们 省 略 了 一 部 分 实现 ， 因 为 代码 太 长 ， 谈 者 可 以 目 己 完成 ， 而 且 代 码 的 书写 和 阅读 都 
比较 乏味 。 我 们 省 略 部 分 代码 的 原因 还 在 于 这 不 是 实现 函数 的 有 效 方 法 。 
上 述 实现 方法 的 主要 问题 在 于 ， 使 用 七 路 if 语句 来 实现 这 类 问题 有 些小 题 大 做 ， 因 为 
本 题 实 际 上 就 是 想 实现 将 星期 名 缩写 “映射 ”到 星期 名 称 。 我 们 现在 知道 了 实现 这 种 映射 的 
最 佳 方法 是 使 用 字典 。 上 因数 complete( ) 的 一 种 更 好 的 实现 方法 如 下 : 


模块 : ch6.py 
' def complete(abbreviation) : 
' 返回 星期 名 缩写 对 应 的 星期 名 称 ， 
days = {'Mo': 'Monday', 'Tu':'Tuesday', 'We': 'Wednesday ' ， 
‘Th “Ihursday',s Fr"s "Friday = Sa "Saturday 


SQRT Sunday’} 


return days[labbreviation] 


6.1.6 ”字典 作为 计数 器 集合 


字典 类 型 的 一 个 重要 应 用 是 计算 较 大 集合 中 “事物 ”出 现 的 次 数 。 例 如 ， 搜 索引 擎 可 能 
需要 计算 Web 页 面 中 每 个 单词 的 出 现 频率 ， 以 便 计算 其 对 于 搜索 引擎 查询 的 相关 性 。 

在 较 小 的 范围 内 ,假设 我 们 希望 在 学 生 姓 名 列表 中 计算 每 个 名 字 出 现 的 频率 ， 例 如 : 

>>> Students = [Ciady'， “John', 'Cindy', ‘Mdam' , ‘Adam'; 

' Ti Tan, Cindy, ‘Jom 

更 准确 地 说 ， 我 们 将 实现 一 个 函数 frequency( )， 带 一 个 列表 (例如 students) 作 
为 输入 参数 ， 计 算 列 表 中 每 个 不 同 项 的 出 现 次 数 。 

像 往 第 一 样 ， 实 现 困 数 frequency() 有 多 种 不 同方 法 。 然 而 ， 最 佳 方法 是 为 每 个 不 
同 的 项 设置 一 个 计数 器 ， 然 后 迭代 列表 中 的 项 : 对 于 每 一 个 迭代 的 项 ， 对 应 的 计数 需 递 增 。 
为 了 完成 任务 ， 我 们 需要 解决 三 个 问题 : 

1. 如 何 确 定 需要 多 少 个 计数 从 ? 

2. 如 何 保 存 这 些 计数 名 ? 

3. 如 何 把 计数 需 与 列表 项 关联 起 来 ? 

第 一 个 问题 的 解决 方案 是 按 需 动态 创建 计数 顺 ， 而 不 管 究 竞 需 要 多 少 个 计数 需 。 换 言 
之 ， 当 迭代 列表 过 程 中 ， 仅 当 第 一 次 遇见 一 个 项 时 ， 为 该 项 创建 一 个 计数 希 。 图 6-3 描述 了 
访问 列表 students 中 的 第 一 个 、 第 二 个 和 第 三 个 名 字 后 的 计数 需 的 状态 。 


绘制 访问 列表 Students 中 接 下 来 三 个 名 字 后 的 计数 器 状态 。 使 用 图 
6-3 作为 模型 ， 绘 制 访问 'Adam' 后 的 状态 图 、 访 问 'Rdam' 后 的 状态 图 和 访问 'Jimmy ' 
后 的 状态 图 。 

图 6-3 让 我 们 知道 如 何 回答 第 二 个 问题 : 我 们 可 以 使 用 字典 存储 计数 需 。 每 个 项 计数 需 
将 是 字典 中 的 一 个 值 ， 该 项 本 身 将 是 与 该 值 相 对 应 的 键 。 例 如 ， 字 符 串 'cindy' 是 键 ， 对 


应 的 值 是 计数 大。 字典 是 键 到 键 值 的 映射 也 回答 了 第 三 个 问题 。 


键 
访问 吧 imdy' 之 后 : 
值 
键 
访问 John' 之 后 : 
值 
键 
访问 “Cindy ' 之 后 : 
值 





图 6-3 ”动态 创建 计数 器 。 在 迭代 列表 students 过 程 中 ， 动 态 创 建 计数 器 。 当 迭代 第 一 个 项 
('Cindgy' ) 时 ， 创 建 一 个 字符 串 ，cindy' 计数 器 。 当 迭代 第 二 个 项 ('John' ) 时 ， 


创建 一 个 "John ' 计数 器 。 妆 迭代 第 三 个 项 (Cindy') 时 ， 和 'Cindy' 关联 的 计 
数 需 递增 


现在 我 们 也 可 以 确定 了 清 数 frequency() 的 返回 值 : 一 个 映射 列表 中 不 同 的 项 到 其 在 
列表 中 出 现 的 次 数 的 映射 的 字典 。 枯 数 的 使 用 示例 如 下 所 未: 


3 = Loimady’, "John', ‘Cindy', ada, AMdam' 
LT Joan's "Clindy', "Joan’)] 

>>> frequency(students) 

Tijohn's Ls Joan's 2 Mam’% 2 ‘Cindy': SB Jimmy s d+} 


> 


在 曙 数 调用 frequency(students) 返回 的 字典 中 (如 图 6-4 所 示 )， 键 是 列表 
students 中 的 不 同 的 名 字 ， 值 是 对 应 于 这 些 名 字 的 出 现 频率 : 因此 'John' 出 现 1 
次 ，'Joan" 出 现 2 次 ， 等 等 。 


ee 了 ware_ ee -一 一 一 mv Se ee | 
" EE 
. 


Cindy | 3 "John" 
; 国 


本- 


'Adam， | oy lB! "Joan' 
; | {i | 
3 | i | 2 | | | 2 | 
| 1 | : 
A 较 | 


ras ao 一 amv oa 


图 6-4 字典 作为 计数 器 容 需 在 列表 students 上 运行 匈 数 frequency( ) 输出 的 列表 
所 有 的 拼图 都 就 位 了 ， 我们 现在 可 以 实现 这 个 函数 : 


模块 : ch6.py 


def frequency(itemList): 
' 返回 列表 中 项 的 频率 ， 
counters = {} # 初始 化 计数 器 字典 


for item in itemList: 


if item in counters: # item 计 缴 各 已 经 六 玫 
counters [item] += 1 # : 计 教 器 疗 了 
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else: # 创建 item 计数 器 、 
counters [item] = 1 # 计数 器 初始 化 为 1 


return counters 


在 第 三 行 counters 字典 被 初始 化 为 空 。for 循环 迭代 列表 itemList 的 项 ， 针 对 每 
个 项 item: 
e 要 么 项 目 item 对 应 的 计数 人 入 加 1; 
e 或 者 ， 如 果 项 目 item 对 应 的 计数 大 不 存在 ， 则 创建 一 个 项 目 item 对 应 的 计数 需 并 
初始 化 为 1。 
注意 累加 硕 模 式 用 于 累积 频率 计数 。 


实现 函数 wordcount()， 带 一 个 文本 (字符 串 ) 作为 输入 参数 ， 输 出 文 
gw 假设 文本 中 没有 标点 符号 ， 单 词 直接 用 空格 分 隔 。 


>>> text = 'all animals are equal but some 
animals are more equal than others' 
>>> wordCount (text) 


all 出 现 了 :1 次 。 
animals 出 现 了 2 次 
some 出 现 了 1 次 。 
equal 出 现 了 2 次 。 
but 出 现 了 1 次 。 
are 出 现 了 2 次 ， 
others 出 现 了 1 次 。 
than 出 现 了 工 凑 
more 出 现 了 工 次 


6.1.7 元 组 对 象 可 以 作为 字典 的 键 
在 练习 题 6.2 中 ,我 们 定义 了 把 电话 号 码 映 射 到 个 人 信息 (名 和 姓 ) 的 字典 : 


>>> rphonebook = {'(123)456-78-90':['Anna’' , 'Karenina’], 
A0124=56=78'5 [Ya Tewn'; 
' (321)908-76-54':['Hans', astorp'j]} 


我 们 使 用 这 个 字典 来 实现 一 个 电话 短 反 加 查询 应 用 程序 : 给 定 一 个 电话 号 码 ， 

返回 该 号 码 对 应 的 个 人 信息 。 假 如 我 们 和 硕 望 构建 另 一 个 程序 ， 实 现 电话 矫正 向 查询 : 给 定 一 
个 人 的 名 和 姓 ， 应 用 程序 返回 个 人 信息 对 应 的 电话 号 码 。 

对 于 正 向 查询 应 用 程序 ， 类 似 于 rphonebook 的 应 用 程序 则 不 合适 。 我 们 需要 一 个 从 
个 人 信息 到 电话 号 人 码 的 映射 。 因 此， 让 我 们 定义 一 个 新 的 字典 ， 实 际 上 是 rphonebook 的 
反问 上 映射: 


>>> Phonebook = {['Anna','Karenina']:'(123)456-78-90',， 
"Vits TS SO1L234=-56=7ZSBL 
['Hans', 'Castorp']:;'(321)908-76-54'} 
Traceback (most recent call last): 
File "<pyshell#242>", line 1, in <module> 
phonebook = {['Anna','Karenina']:'(123)456-78-90'!',， 
TypeError: unhashable type: 'list' 
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哎呀 ， 出 错 了 。 问 题 在 于 我 们 试图 定义 一 个 键 为 列表 对 象 的 字典 。 回 顾 前 文 ，1ist 类 
型 是 可 变 类 型 ,字典 键 必 须 是 不 可 变 类 型 。 

解决 方法 是 使 用 内 置 元 组 ( tuple) 类 。 因 为 元 组 对 象 是 不 可 变 类 型 ， 所 以 可 以 用 作 字 
典 的 键 。 让 我 们 回 到 最 初 的 目标 : 构建 一 个 字典 ， 把 个 人 信息 (名 和 姓 ) 映射 到 电话 号 码 。 
现在 可 以 使 用 tuple 对 象 作 为 键 来 代替 1ist 对 象 : 


>>> phonebook = {('Anna','Karenina'):'(123)456-78-90', 
Com Tauro0L) 6=787. 
('Hans', 'Castorp'):'(321)908-76-54'} 

>>> phonebook 

{('Hans', 'Castorp'): '(321)908-76-54°', 

(Ya, Toun")e "tt00 D3456-.78", 

("Anna', ‘'Karenina!): '(123)456-78-90'} 


让 我 们 检查 索引 运算 符 是 否 符合 预期 : 


>>> phonebook[('Hans', 'Castorp')] 
'(321)908-76-54' 


现在 ,我 们 就 可 以 实现 正身 电话 簿 查询 工具 了 。 


s 嘱 3 了 和 量 ? 归 时。 实现 了 吕 数 lookup( ) : 实现 正 向 电话 簿 查询 应 用 程序 。 吕 数 带 一 个 表示 
电话 簿 的 字典 作为 输入 参数 。 在 字典 中 ， 包 含 个 人 信息 (名 和 姓 ) 的 元 组 ( 键 ) 映射 到 包含 
电话 号 码 的 字符 串 ( 值 )。 示 例如 下 : 


>>> phonebook = {('Anna','Karenina'):'(123)456-78-90', 
(rai “Tan (O02.50- 28', 
('Hans', 'Castorp'):'(321)908-76-54'} 


函数 必须 提供 一 个 简单 的 用 户 界面 ， 提 示 用 户 输入 名 和 姓 ， 返 回 该 个 人 信息 对 应 的 电话 


>>> lookup (phonebook) 
请 输入 名 : Anna 

请 输入 姓 : Karenina 
(123)456-78-90 

请 输入 名 : Yu 

请 输入 姓 : Tsun 
(901)234-56-78 


68.2 集合 


本 节 将 介绍 男 一 个 内 置 Python 容 占 。set 类 (集合 ) 具有 数学 集合 的 所 有 属性 。set 
对 象 用 于 存储 无 序 的 项 集合 ， 不 允许 重复 项 。 集 合 中 的 项 必须 是 不 可 变 对 象 。set 类 型 支持 
用 于 实现 经 典 集合 运算 的 运算 符 : 集合 成 员 、 交 集 、 并 集 、 对 称 差 ， 等 等 。 因 此 ， 它 适用 于 
把 一 个 项 目 集 合 建 模 为 数学 集合 ， 也 适用 于 删除 重复 项 。 

集合 使 用 数学 集合 中 同样 的 符号 来 定义 : 包含 在 花 括号 ( {}) 中 ， 并 且 由 有 喜 号 分 隅 的 项 
序列 。 把 三 个 电话 号 码 (作为 字符 串 ) 组 成 的 集合 赋值 给 变量 phonebook1 的 方法 如 下 : 


>>> phonebookl = {'123-45-67', '234-56-78','345-67-89'} 


检查 phonebook1 的 值 和 类 型 : 
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>>> Ca 

{123-46=67:, '934-56-78'+, '345-67-89' 
>>> type (phonebook1) 

下 SS get "> 


如 有 果 定 义 集合 时 包含 重复 的 项 ， 则 忽略 重复 项 : 


>>> phonebookl = {'123-45-67', '234-56-78',，'345-67-89 
'123-45-67", '345=67-89°*} 

>>> PO 

{4' 409-425-67"*  '234=56=78", ‘345-67=89*} 


6.2.1 使 用 set 构造 函数 移 除 重复 项 


集合 不 能 有 重复 项 的 事实 为 我 们 提供 了 集合 的 第 一 个 伟大 应 用 : 从 列表 中 删除 重复 项 。 
假设 我 们 有 一 个 有 重复 项 的 列表 ， 比 如 一 个 班 学 生 的 年 龄 列表 : 


333 gen = [L298 3 (6 21: 18 到 A 2 2 19 20] 


要 移 除 该 列表 中 的 重复 项 ， 我 们 可 以 使 用 set 构造 水 数 把 列表 转换 为 一 个 集合 。set 
构造 咽 数 将 移 除 所 有 的 重复 项 ， 因 为 集合 中 不 允许 重复 项 。 通 过 把 集合 重新 转换 为 列表 ， 即 
可 以 获得 没有 重复 项 的 列表 : 


>>> ages = list(set(ages)) 
>>> ages 
LD 49 0 2 


然而 ， 存 在 一 个 主要 的 问题 : 元 素 被 重新 排序 


注意 事项 : 空 集合 
如 何 初始 化 一 个 空 集合 呢 ， 读 者 有 可 能 尝试 如 下 方法 : 


>>> phonebook2 = {} 


如 果 检 查 phonebook2 的 类 型 ， 我 们 发 现 它 是 字典 类 型 : 

>>> type(phonebook2) 

<class 'dict'> 

问题 的 所 在 是 花 括 号 〈({f}) 也 用 于 定义 字典 ，{} 表 示 一 个 空 字典 。 如 果 是 这 样 的 话 ， 
那么 提出 了 两 个 问题 : 

1. Python 如 何 区 分 集合 和 字典 符号 ? 

2. 我 们 如 何 创建 一 个 空 集合 ? 

第 一 个 问题 的 谷 案 如 下 : 尽管 集合 和 字典 都 使 用 花 括号 内 过 号 分 隔 的 序列 项 表示 ， 字 
典 中 的 项 是 由 冒号 (:) 分 隔 的 ( 键 ， 值 ) 对 ， 而 集合 的 项 则 不 以 冒号 分 隔 。 

第 二 个 问题 的 答案 是 我 们 使 用 set 构造 函数 显 式 创建 一 个 空 集合 : 


>>> phonebook2 = set() 


检查 phonebook2 的 值 和 类 型 ， 确 保 它 是 一 个 空 集合 : 
>>> phonebook2 
set () 


>>> type (phonebook2) 
<class 'set'> 
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6.2.2 set 运算 符 


set 类 文 持 与 通常 的 数学 集合 运算 相对 应 的 运算 符 。 有 些 是 可 以 与 列表 、 字 符 串 和 字典 
类 型 一 起 使 用 的 操作 符 。 例 如 ， 运 算 符 in 和 not 用 于 测试 集合 成 员 : 


>>> '123-45-67' in phonebookl 


True 

>>> '456-78-90' in phonebookl 
False 

>>> '456-78-90' not in phonebookl 
True 


len( ) 运算 符 返 回 集合 的 大 小 : 


>>> len(phonebook1) 
3 


集合 同样 支持 比较 运算 符 ==、!=、<、<=、> 和 >=， 但 其 意义 与 特定 的 集合 相关 。 两 
个 集合 仅 当 其 元 素 相 同 才 “相等 ”。 


>>> phonebook3 = {'345-67-89','456-78-90'} 
>>> phonebookl1 == phonebook3 

False 

>>> phonebookl != phonebook3 

True 


如 图 6-5 所 示 ，phonebook1l1 和 phonebook3 的 元 素 不 相同 。 


le r 1 
phonebook!1 、 ie 和 
phonebook3 phonebook?2 


123-45-67 
SO 
234-56-78 


图 6-5 ”三 个 电话 秒 集 合 phonebook1、phonebook2 和 phonebook3 的 维 恩 因 


如 果 集 合 A 是 集合 B 的 子 集 ， 则 集合 A“ 小 于 或 等 于 ”集合 B ; 如 果 和 集合 A 是 集合 B 
的 真子 集 ， 则 集合 A“ 小 于 ”集合 B。 


>>> {'123-45-67', '345-67-89'} <= phonebook1 
True 


如 图 6-5 所 示 ， 集合 {'123-45-67','345-67-89'} 是 集合 phonebook1 的 子 集 。 
但 是 ，phonebook1 不 是 phonebook1 的 真子 集 : 






>>> phonebookl1 < phonebookl 
False 


数学 集合 运算 的 并 集 、 交 集 、 差 集 、 对 称 差 ， 分别 实现 为 集合 运算 符 | 、&、-、 和 “。 
每 个 set 运算 符 接受 两 个 集合 作为 输入 参数 ， 并 返回 一 个 新 集合 。 两 个 集合 的 并 集 包 含 两 
个 集合 中 的 所 有 元 素 : 


>>> Phonebookl | phonebook3 
"13-45-671 54-56-751 "S45-67-89', '456-78-90*:} 


两 个 集合 的 交集 包含 两 个 集合 中 共同 的 元 又 : 


>>> Phonebookl & phonebook3 
{'345-67-89'} 


会 器 和 展 机 性 13% 


两 个 集合 的 差 集 包 含 所 有 属于 第 一 个 集合 但 不 属于 第 二 个 集合 的 元 素 : 


>>> phonebookl1 - phonebook3 
1103s46=871 T0234-56=78'} 


两 个 集合 的 对 称 差 包含 第 一 个 集合 或 第 二 个 集合 中 的 元 素 ， 但 不 包含 两 个 集合 共同 的 


元 系 : 


>>> phonebookl ~ Phonebook3 
{'428-45-67', 1234-56-781，，1456-75-991} 


使 用 图 6-5$ ， 检 查 集 合 运算 符 的 正确 性 。 
在 继续 讨论 集合 类 方法 之 前 ， 我 们 在 表 6-3 中 总 结 了 我 们 刚刚 讨论 的 常用 集合 运 


算 符 。 
表 6-3 类 set 的 运算 符 。 表 中 列举 了 一 些 常用 的 集合 运算 符 的 用 法 和 说 明 
运 算 符 说 明 
x in S 如 果 x 包含 在 集合 s 中 ， 则 返回 True; 否则 返回 False 
x not in 8 如 果 x 包含 在 集合 s 中 ， 则 返回 False; 否则 返回 True 
len(s) 返回 集合 s 的 大 小 
5 = 老 如 果 集 合 s 和 七 包含 相同 的 元 素 ， 则 返回 True; 否则 返回 False 
s != t 如 朵 集合 s 和 不 包含 相同 的 元 素 ， 则 返回 True; 和 否则 返回 False 
S <= 七 如 果 集 合 s 的 每 个 元 素 都 包含 在 集合 七 中 ,， 则 返回 True; 否则 返回 False 
S < 七 如 果 s <= 七 并 且 s != 七 则 返回 True; 否则 返回 False 
s | 蕊 返回 集合 s 和 + 的 并 集 
s & 七 返回 集合 s 和 + 的 交集 
s = 七 返回 集合 s 和 + 的 差 集 
-a 返回 集合 s 和 + 的 对 称 差 


6.2.3 ”5et 方法 


集 


2 
口 


除了 运算 符 之 外 ，set 类 还 支持 若干 方法 。set 方法 add( ) 用 于 把 一 个 项 添加 到 一 个 


>>> phonebook3.add('123-45-67') 
>>> eat 
{'123-45-67', '345-67-89','456-78-90'} 


方法 oe ) 用 于 从 一 个 集合 中 删除 一 个 项 : 


>>> phonebook3.remove('123-45-67') 
>>> phonebook3 
{'345-67-89', '456-78-90'} 


， 方 法 clear( ) 用 于 清空 集合 : 
>>> phonebook3.clear() 


检查 发 现 phonebook3 确实 为 空 : 


>>> phonebook3 
set () 


楼 了 解 更 多 关于 set 类 的 信息 ,请 阅读 在 线 文档 ,或 者 使 用 文档 帮助 函数 help( )。 


了 请 污 尖 编写 函数 sync( ) ， 带 一 个 包含 若干 电话 簿 的 列表 (每 个 电话 簿 都 是 一 个 
电话 号 码 集合 ) 作为 输入 参数 ， 返 回 和 包含 一 个 所 有 电话 簿 并 集 的 电话 簿 (集合 )。 

>>> phonebook4 = {'234-56-78', '456-78-90'} 

>>> phonebooks = [phonebook1, phonebook2, phonebook3, phonebook4] 


>>> sync(phonebooks) 
{'934-56-78" , '456-78-90', "123-45-67', '345-67-89'} 


6.3 字符 编码 和 字符 串 


字符 串 类 型 ( str) 是 用 于 存储 文本 值 的 Python 类 型 。 在 第 2 章 和 第 4 章 中 ;我 们 已 经 
讨论 了 如 何 创建 字符 串 对 象 ， 使 用 字符 串 运算 符 和 方法 对 它们 进行 操作 。 当 时 的 假设 是 我 们 
正在 处 理 包含 灿 文 文本 的 字符 串 对 象 。 这 种 假设 有 助 于 使 字符 串 处 理 看 起 来 直观， 但 也 隐藏 
了 字符 串 表 示 的 复杂 性 和 丰富 性 。 我 们 现在 讨论 文本 表示 的 复杂 性 ， 是 由 于 我 们 所 说 和 写 的 
世界 语言 中 包含 大 量 的 符号 和 字符 。 我 们 将 具体 讨论 字符 串 可 以 包含 哪些 字符 。 


6.3.1 字符 编码 


字符 串 对 象 用 于 存储 文本 ， 字 符 串 就 是 字符 的 序列 。 字 符 可 以 是 大 写字 母 和 小 写字 母 、 
数字 、 标 点 符号 和 其 他 如 美元 符号 ($) 的 符号 。 正 如 我 们 在 第 2 章 中 讨论 的 ， 要 创建 值 为 
文本 'An apple costs $0.991' 的 变量 ， 可 以 使 用 如 下 赋值 语句 : 


>>> text = 'An apple costs $0.991， 
变量 text 的 求全 结果 为 文本 : 
>>> text 


AD apple costs 和 0 .991 


里 然 这 一 切 看 起 来 既 人 简洁 又 直观 ,但 是 字符 串 在 某 种 程度 上 比较 复杂 。 问 题 的 根源 是 
计算 机 处 理 的 是 二 进 制 位 和 字 节 ， 故 字符 串 值 需要 编码 为 二 进 制 位 和 字 节 。 换 言 之 ， 字 符 
串 值 的 每 个 字符 都 需要 映射 到 特定 的 二 进 制 位 编码 ， 而 这 种 编码 应 该 能 反问 映射 回 到 该 
字符 。 

但 是 我 们 为 什么 要 关心 这 种 编码 呢 ? 正如 我 们 在 第 2 章 和 第 4 章 中 所 看 到 的 ， 操 作 字 
符 串 是 非常 直观 的 ， 我 们 当然 不 担心 字符 串 是 如 何 编码 的 。 大 多 数 时 候 ， 我 们 不 必 关 心 编 
码 问题 。 然 而 ， 在 全 球 互联 网 中 ， 在 一 个 位 置 创建 的 文档 可 能 需要 在 男 一 个 位 置 读 取 。 我 
们 需要 知道 如 何 处 理 来 自 其 他 书写 系统 的 字符 ， 不 管 它们 是 来 自 其 他 语言 的 字符 ， 如 法 语 、 
希腊 语 、 阿 拉 伯 语 或 汉语 ， 还 是 来 自 不 同 领 域 的 符号 ， 如 数学 、 科 学 或 工程 。 同 样 重要 的 
是 ,我 们 需要 理解 字符 串 是 如 何 表示 的 ， 因 为 作为 计算 机 科学 家 ， 我们 确实 想 知道 其 内 部 
原理 。 


6.3.2 ASCII 


多 年 来 ,英语 中 字符 的 标准 编码 是 ASCI1。 美 国信 息 交 换 标准 码 (ASCII) 是 20 世纪 60 
年 代 发 展 起 来 的 ， 它 定义 了 128 个 字符 、 标 点 符号 以 及 美国 秽语 中 第 见 的 一 些 其 他 符号 的 数 
字 代 人 码 。 表 6-4 显示 了 可 打印 字符 的 十 进 制 ASCII 码 。 
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让 我 们 解释 一 下 这 个 表 各 条 目的 含义 。 小 写字 母 a 的 十 进 制 ASCII 码 是 97。 符 号 & 
编码 为 十 进 制 ASCI 码 38。ASCI 码 0 到 32 和 127 包 含 不 可 打印 字符 ， 例 如 退 格 键 (十 
进 制 编码 8 )、 as (十 进 制 编码 9)、 换 行 符 (十进制 编码 10 )。 使 用 Python 函数 
ord()， 可 以 返回 一 个 字符 的 十 进 制 ASCII 编码 : 


>33 Grd("a’,) 
97 


由 字符 序列 组 成 的 字符 串 值 (例如 “aad”) 被 编码 为 ASCII 码 序 列 : 100、97 和 100。 
存储 在 内 存 中 的 就 是 这 一 系列 的 编码 。 当 然 ， 每 个 代码 都 存储 为 二 进 制 。 由 于 ASCII 十 进 
制 码 范围 从 0 到 127， 所 以 可 以 用 7 位 编码 ; 因为 一 个 字 节 (8 个 二 进 制 位 ) 是 最 小 的 内 存 
存储 单元 ， 所 以 每 个 编码 都 存储 在 一 个 字 节 中 。 

例如 ， 小 写字 母 a 的 十 进 制 ASCII 码 是 97， 它 对 应 于 二 进 制 ASCII 码 1100001 。 
在 ASCII 编码 中 ， 和 字符 a 被 编码 在 一 个 字 节 中 ， 第 一 位 为 0， 其 余 的 位 为 1100001。 结 果 字 
te ep 
0001 是 1 )。 事实 上 ,使 用 十 六 进 制 ASCII 码 (作为 ASCII 二 进 制 代码 的 简写 ) 是 很 常见 的 。 

例如 ， 符 号 & 编码 为 十 进 制 ASCII 码 38， 对 应 于 二 进 制 编码 0100110 和 十 六 进 制 编码 
QxXZ6. 


编写 一 个 函数 encoding()， 带 一 个 字符 串 作为 输入 参数 ， 输 出 字符 囊 
sree 制 、 十 六 进 制 、 二 进 制 】 表示。 


>>> encoding('dad') 
Char Decimal Hex Binary 


d 100 64 1100100 
a 97 61 1100001 
d 100 64 1100100 


商 数 chr ( ) 是 浮 数 ord( ) 的 反 困 数 。 它 接受 一 个 数值 编码 参数 ， 返 回 对 应 的 字符 。 


>>> chr(97) 
和 编写 了 荡 数 char (low，high)， 输出 所 有 十 进 制 编码 i 对 应 的 字符 : i 的 
值 从 low 到 high (包括 high)。 
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6.3.3 Unicode 


ASCII 编码 是 美国 的 标准 。 因 此 ， 它 没有 提供 美国 英语 之 外 的 字符 编码 。ASCII 编码 中 
不 包括 法 语 的 “《”、 希 腊 语 的 “A ”或 中 文 的 “ 世 ” 字 。 除 ASCII 编码 以 外 ， 还 开发 了 许 
多 编码 ， 用 于 处 理 不 同 的 语言 或 一 组 语言 。 但 是 ， 这 导致 了 一 个 问题 ， 随 着 不 同 编码 的 存 
在 ,一 台 计 算 机 上 可 能 没有 安装 某 些 编码 。 在 一 个 全 球 互联 的 世界 里 ,一 台 计 算 机 上 创建 的 
文本 文档 常常 需要 在 男 一 台 计 算 机 上 读 取 。 如 果 读 取 文 档 所 在 的 计算 机 中 没有 正确 的 编码 ， 
该 怎么 办 呢 ? 

Unicode 编码 被 开发 成 为 通用 字符 编码 方案 。 它 涵盖 了 所 有 书面 语言 的 所 有 字符 (无 论 
是 现代 的 还 是 古代 的 )， 包 括 科 学 、 工 程 学 、 数 学 的 技术 符号 、 标 点 符号 等 。 在 Unicode 编 
但 中 ， 每 个 字符 都 用 整数 编码 表示 。 编 码 不 一 定 是 字符 的 实际 字 节 表示 ， 它 只 是 特定 字符 的 
标识 符 。 

例如 ， 小 写字 母 “k” 的 编码 为 十 六 进 制 值 0x006B ， 对 应 于 十 进 制 值 107 的 整数 。 在 
表 6-4 可 以 发 现 ，107 也 是 字母 “k” 的 ASCII 码 。Unicode 合乎 时 宜 地 使 用 与 ASCII 编码 
相同 的 编码 表示 ASCII 字符 。 

如 何 将 Unicode 字符 合并 到 字符 串 中 ?例如 ， 如 果 要 包括 字符 “k”， 可 以 使 用 Python 
的 转 义 序列 \u006B: 

>>> NuU006B， 

在 下 面 的 例子 中 ， 转 义 字 符 \u0020 用 来 表示 编码 为 0x0020 (十 六 进 制 ， 对 应 于 十 进 
制 的 32 ) 的 Unicode 字符 。 很 显然 ， 这 是 空白 字符 ( 见 表 6-4 ): 


>>> Hollo\UOO0ZO0WOrie 41 
"Hello Werld. $3 


现在 我 们 尝试 使 用 几 个 不 同 语言 的 例子 。 让 我 们 从 西里 尔 语 中 我 的 名 字 开 始 : 


>>> '\u0409\u0443\u0431\u043e\u043c\u0Q438\u0440' 
' byOoMHY' 


下 面 是 希腊 语 中 的 “Hello World! ”: 


>>> '\u0393\u03b5\u03b9\u03bi\u0020\u03c3\u03b1l\u03c2 
\uUO0020\uO03ba\u03cc\u03c3\u03bc\u03bf! 
'T'ew ouc XOoUO!' 
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最 后 ， 让 我 们 输出 中 文中 的 “Hello World! ”: 


>>> chinese = '\u4e16\u7S54c\u60a8\u597d1!'! 
>>> chinese 
' 世 界 你 好 !， 


让 我 们 验证 基本 字符 串 运 算 符 在 字符 串 上 的 运行 结果 : 
>>> len(chinese) 


5 
>>> chinese[0] 


字符 串 运 算 符 与 字符 使 用 的 字符 集合 无 关 。 让 我 们 验证 ord( ) 和 chr() 曙 数 是 否 能 从 
ASCII 编 公 拓展 到 Unicode 编码 : 


>>> ord(chinese[0]) 
19990 
>>> chr(19990) 


困 数 照样 起 作用 ! 注意 19990 是 十 六 进 制 值 0x4e16 的 十 进 制 什 ， 当 然 它 是 字符 “ 世 ” 
的 Unicode 编码 。 因 此 ， 内 置 困 数 ord( ) 实际 上 市 一 个 Unicode 字符 作为 输入 参数 ， 输 出 
其 Unicode 编码 的 十 进 制 值 ; chz() 则 相反 。 两 个 果 数 同样 适用 于 ASCII 字符 的 原因 在 于 ， 
ASCII 字符 的 Unicode 编码 被 设计 为 和 ASCII 码 相 同 。 


知识 拓展 : 字符 串 比较 (深入 研究 ) 

既然 我 们 知道 字符 串 是 如 何 表示 的 ， 我 们 就 可 以 理解 字符 串 比 较 是 如 何 工 作 的 。 首 
先 ，Unicode 编码 是 整数 ， 因 此 所 有 Unicode 编码 可 以 表示 的 字符 具有 自然 序 。 例 如 ， 空 
格 “ ”排序 在 西里 尔 字 符 古 之 前 ， 因 为“ ”的 Unicode 编码 (0x0020 ) 整数 值 比 “ 古 
的 Unicode 编码 ( 0x0409 ) 要 小 : 

>>> '\u0020' > '\u0409' 

False 

>>> '\u0020' < 'Nu0409， 

True 

Unicode 编码 的 设计 使 得 同一 个 字母 表 中 任意 一 对 字符 对 满足 : 在 字母 表 中 一 个 字符 
比 另 一 个 字符 出 现 得 早 ， 则 其 Unicode 编码 也 更 小 。 例 如 ， 字 母 表 中 的 “a” 在 “d” 之 
前 ,“a” 的 编码 比 “d” 的 编码 要 小 。 通 过 这 种 方式 ，Unicode 字符 形成 一 个 有 序 的 字符 
集合 ， 它 与 Unicode 编码 覆盖 的 所 有 字母 表 保 持 一 致 。 

当 比 较 两 个 字符 串 时 ， 我 们 已 经 说 明 比 较 是 用 字典 顺序 完成 的 。 字 典 顺 序 (dictionary 
order) 的 另 一 个 名 字 是 词典 序 (Lexicographic order)。 这 个 顺序 可 以 精确 地 定义 ， 现 在 我 
们 知道 字符 来 自 有 序 集合 (Unicode)。 单 词 : 

aiayas "a 

在 词典 序 中 排 在 单词 : 

中 

之 前 ， 必 须 满 足下 列 条 件 之 一 : 

ai=b,，Qs=by，"…，q=b, 并且 k 过 1 

满足 a; 和 bb 不同 的 最 小 索引 i，a; 的 Unicode 编码 小 于 b; 的 Unicode 编码 。 


6.3.4 ” Unicode 字符 的 UTF-8 编码 


一 个 Unicode 字符 串 是 一 个 代码 序列 ， 代 码 范 围 是 从 0 到 0x10ffff 的 数字 。 然 而 ， 与 
ASCII 码 不 同 的 是 ，Unicode 代码 并 不 是 存储 在 内 存 中 的 代码 。 将 Unicode 字符 或 代码 转换 
成 字 节 序 列 的 规则 称 为 编码 。 

存在 不 止 一 个 而 是 若干 个 Unicode 编 码 : UTF-8、UTF-16 和 UTF-32。UTF 代表 
Unicode Transformation Format ( Unicode 转换 格式 )， 每 个 UTF-x 定义 了 一 种 不 同 的 方式 来 
映射 一 段 Unicode 代码 到 字 节 序列 。UTF-8 编码 已 成 为 那些 字符 存储 或 在 网 络 中 发 送 字 符 
的 电子 邮件 、 网 页 和 其 他 应 用 程序 的 首选 编码 。 事 实 上 ， 当 你 编写 Python 3 程序 时 ， 默 认 
编码 是 UTF-8。UTF-8 的 一 个 特点 是 : 每 一 个 ASCII 字符 ( 即 表 6-4 中 每 个 字符 ) 都 有 一 
UTF-8 编码 ， 正 好 与 8 位 (一 个 字 节 ) 的 ASCII 编码 相同 。 这 意味 着 一 个 ASCII 文本 是 用 
UTF-8 编码 的 Unicode 文本 。 

在 某 些 情况 下 ， 你 的 Python 程序 将 接收 没有 指定 编码 的 文本 。 例 如 ， 当 程序 从 万 维 网 
(我 们 将 在 11 章 中 讨论 ) 下 载 文本 文档 的 情况 。 在 这 种 情况 下 ,Python 别 无 选择 ， 只 能 将 “ 文 
本 ” 视 为 存储 在 bytes 类 型 对 象 中 的 原始 字 节 序列 。 这 是 因为 从 网 络 下 载 的 文件 可 能 是 网 
像 、 视 频 、 音 频 ， 而 不 仅仅 是 文本 。 

考虑 如 下 从 Web 下 载 的 文本 文件 的 内 容 : 

>>> content 

b'This is a text document\nposted on theNnWWW .Nn'， 

变量 content 指 问 类 型 pytes 的 一 个 对 象 。 读 者 可 以 验证 ,“ 字 符 串 ”前 面 的 字母 b 
表示 : 


>>> type(content) 
<class 'bytes '> 


要 使 用 UTF-8 的 Unicode 编 码 把 它 解码 为 字符 串 ， 我 们 需要 使 用 bytes 类 的 
decode( ) 方法 : 


>>> content.decode('utf-8') 


IThis is a text document\nposted on the\nWWW.\n' 


如 果 调 用 方法 decode( ) 时 没有 带 人 参数 ， 则 默认 情况 下 ， 使 用 与 平台 相关 的 编码 : 
Python 3 的 编码 是 UTF-8 (Python 2 的 编码 是 ASCII 码 )。 


知识 拓展 : 文件 和 编码 
用 于 打开 一 个 文件 open() 函数 的 第 三 个 可 选 参数 是 读 取 或 写 入 文本 文件 的 编码 。 
如 果 未 指定 ， 将 使 用 与 平 全 相关 的 默认 编码 。 此 参数 仅 在 文本 模式 下 使 用 。 如 果 用 于 二 进 
制 文件 ， 则 会 出 现 错误 。 让 我 们 通过 显 式 指定 UTF-8 编码 打开 文件 chinese .txt: 


>>> infile = open('chinese.txt', 'r', encoding='utf-8') 
>>> ee read()) 


[Ls 
rie | 闪 3 
Le 4 : 


(translation: Hello World!) 


6.4 random 模块 
随机 数 对 运行 科学 、 工 程 和 金融 的 模拟 仿真 非常 有 用 。 它 们 是 提供 计算 机 安全 、 通 信和 隐 
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私 和 身份 验证 的 现代 加 密 协 议 所 必需 的 。 它 们 也 是 随机 游戏 (如 扑克 有 牌 游戏 或 二 十 一 点 游戏 ) 
中 必 不 可 少 的 组 成 部 分 ， 可 以 帮助 减少 电脑 游戏 的 可 预测 性 。 
真正 的 随机 数 是 不 容易 获得 的 。 大 多 数 要求 随 机 数 的 计算 机 应 用 程序 使 用 的 是 由 伪 随 机 
数 发 生 器 生成 的 数字 。“ 伪 随机 ”中 的 “ 伪 ” 表 示 假 的 ， 或 不 是 真 的 。 伪 随机 数 发 生 替 是 一 
种 生成 “看 起 来 ”随机 的 一 系列 数 的 程序 ， 可 以 满足 需要 随机 数 的 大 多 数 应 用 程序 的 需求 。 
在 Python 中 ， 伪 随机 数 发 生 需 和 相关 工具 可 以 通过 random 模块 获得 。 像 往常 一 样 ， 
如 果 需 要 使 用 random 模块 中 的 图 数 ， 我 们 需要 首先 导入 它 : 


>>> import random 


接 下 来 ,我 们 将 描述 random 模块 中 若干 特别 有 用 的 函数 。 


6.4.1 选择 一 个 随机 整数 


我 们 首先 讨论 函数 randrange( )， 该 男 数 带 两 个 输入 参数 : 一 对 整数 a 和 bb， 返回 从 
a (包括 a) 到 4b (不 包括 b) 范围 内 的 一 个 整数 。 选 中 范围 内 的 每 个 整数 的 概率 相同 。 下 面 
展示 我 们 如 何 使 用 这 个 艺 数 来 模拟 几 次 撕 骨 子 ( 骨 子 有 6 个 面 ): 


>>> random.randrange(1,7) 
2 
>>> random.randrange(1,7) 
6 
>>> random.randrange(1,7) 
5 
>>> random.randrange(1,7) 
1 
>>> random.randrange(1,7) 
2 


实现 函数 guess( )， 市 一 个 整数 n 作为 输入 参数 ， 实 现 一 个 简单 的 交互 
式 猜 数 游戏 。 函 数 首 先 选择 一 个 从 0 到 于 (不 包括 中) 范围 内 的 随机 数 。 然 后 重复 请 求 用 户 
猜测 所 选择 的 随机 数 。 如 果 用 尸 猜 测 正确 ， 则 函数 输出 'You got it.' 提示 信息 并 终止 。 
每 次 用 户 猜 测 错误 ， 函 数 输出 帮助 信息 提示 用 户 : 'Too Low.' 或 者 'Too high.'。 


>>> guess(100) 

Enter your guess: 50 
Too low. 

Enter your guess: 75 
Too high. 

Enter your guess: 62 
Too high. 

Enter your guess: 56 
Too low. 

Enter your guess: 59 
Too high. 

Enter your guess: 57 
You got it! 


知识 拓展 : 随机 性 
我 们 通 第 把 找 硬 币 的 结果 (正面 或 背面 ) 看 作 是 随机 事件 。 大 多 数 随 机 游戏 取决 于 随 
机 事件 的 产生 〈 掷 鹏 子 、 洗 牌 、 轮 盘 赌 ， 等 等 )。 这 些 生成 随机 事件 的 方法 存在 的 问题 是 ， 


它们 不 适合 在 运行 中 的 计算 机 程序 中 足够 快 地 产生 随机 性 。 事 实 上 ， 计 算 机 程序 生成 真正 
的 随机 数 是 不 容易 的 。 为 此 ， 计 算 机 科学 家 们 开发 了 确定 性 算法 ， 称 为 伪 随 机 数 发 生 器 ， 
产生 “随机 ”出 现 的 数字 。 


6.4.2 ”选择 一 个 随机 “实数 ” 


有 了 时候， 我 们 在 应 用 程序 中 需要 的 不 是 随机 整数 ， 而 是 从 给 定 的 数字 间隔 中 选择 随机 
数 。 困 数 uniform( ) 市 两 个 参数 : 数值 a 和 4b， 返回 一 个 浮 点 数 x， 满足 a 三 x 三 4b ( 假 
设 a 三 5b)。 选 中 郊 围 中 的 每 个 浮 点 值 概率 相同 。 下 面 是 获取 阁 干 0 到 1 之 间 的 随机 数 的 

>>> random.uniform(0,1) 

0.9896941090637834 

>>> random.uniform(0,1) 

0.3083484771618912 


>>> random.uniform(0,1) 
0.123744515148957152 








5 有 一 种 估 值 数学 常量 区 的 方法 : 通过 在 飞镖 靶 上 投 搓 飞镖 。 虽 然 这 不 
是 估 值 元 的 好 方法 ， 但 很 有 趣 。 假 如 在 墙 上 有 一 个 2x2 的 正方 形 ， 其 中 有 一 个 半径 为 1 
的 飞镖 靶 。 现 在 随机 投掷 飞镖 ， 假 设 在 击 中 正方 形 的 灵 个 飞镖 中 ， 有 大 个 击 中 飞镖 靶 ( 见 
图 6-6 )。 


图 中 显示 了 10 次 随机 投 搓 飞 
镖 8 次 击 中 内 部 的 飞镖 靶 。 在 这 


种 情况 下 ,的 估 值 是 一 一 =3.2 


图 6-6 正方 形 中 的 飞镖 邯 


因为 随机 投 三 飞镖 ， 因 此 li 大 约 与 飞镖 靶 面 积 (nx1’) 和 周围 的 正方 形 面 积 (2*) 之 
比 相 同 。 换 言 之 ， 有 如 下 约 等 式 : 


k 
n 


重新 组 织 上 述 约 等 式 ， 可 以 用 于 估 值 x: 
4k 
“ 
实现 函数 approxPi()， 之 一 个 整数 姥 作 为 输入 参数 ， 模 拟 于 次 随机 投 拉 飞镖 到 一 个 
包含 飞镖 靶 的 2x2 正 方形 墙 面 ， 统 计 击 中 飞 杀 靶 的 次 数 ， 并 根据 击 中 次 数 和 严 估 值 并 返回 
TT。 注意 : 为 了 模拟 随机 投 搓 飞 镖 到 正方 形 墙 面 ， 只 需要 获得 击 中 位 置 的 YX 和 ?了 坐标 。 


元 


>>> approxPi(1000) 
3.028 
>>> approxPi(100000) 
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3.1409600000000002 
>>> approxPi(1000000) 
3.141702 

>>> 


6.4.3 ”随机 混 排 、 挑 选 和 抽样 


让 我 们 先 举例 说 明 random 模块 中 其 他 一 些 师 数 的 用 法 。 困 数 shuffle( ) 混 排 或 置 
换 一 个 序列 中 的 对 象 ， 这 类 似 于 纸牌 游戏 (如 二 十 一 点 ) 之 前 一 副 牌 被 洗 牌 。 每 种 排列 的 概 
率 相同 。 以 下 示例 演示 如 何 使 用 shuffle( ) 函数 把 一 个 列表 混 排 两 次 : 


Sy Tat a [1,.2.3.4.5} 
>>> random.shuffle(lst) 
SS at 

fi 

>>> random.shuffle(lst) 
>>> 18t 

时 


果 数 choice() 允许 我 们 从 一 个 容 冀 中 均 实 随机 选择 一 个 项 。 例 如 ， 给 定 如 下 列表 : 
SS Fat [Licat's ‘ras!, at's ‘marl 
我 们 可 以 均 实 随机 选择 一 个 列表 项 : 


>>> random.choice(lst) 
matt 
>>> random.choice(1st) 
‘Dat 
>>> random.choice(lst) 
>>> random.choice(lst) 


‘从 碟 忆 

如 果 不 止 需要 一 个 项 而 是 需要 有 个 采样 ， 每 个 采样 概率 相同 ， 则 可 以 使 用 sample() 
函数 。 该 明 数 带 两 个 输入 参数 容器 和 数值 。 

下 面 我 们 从 列表 1st 中 随机 采样 大 小 为 2 或 3 的 子 列表 : 


>>> random.sample(lst, 2) 


L'mat', "vat 
>>> random.sample(lst, 2) 
[， < !rat'] 


>>> random.sample(lst, 3) 
L'a 


6.5 电子 教程 案例 研究 : 机 会 游戏 


随机 游戏 (如 扑 殉 有 牌 游 戏 和 二 十 一 点 游戏 ) 已 经 成 功 过 滤 到 数字 时 代 。 在 案例 研究 CS.6 
中 ,我 们 展示 了 如 何 开发 一 个 二 十 一 点 扑克 牌 游戏 应 用 程序 。 在 开发 这 个 应 用 程序 的 过 程 
中 ， 我 们 使 用 了 本 章 中 介绍 的 几 个 概念 : 集合 、 字 典 、Unicode 字符 ， 当 然 还 有 通过 洗 牌 产 
生 随 机 性 。 
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6.6 本章 小 结 


本 章 首 先 介 绍 几 个 内 置 的 Python 容 需 类 ， 它 们 是 我 们 目前 使 用 的 字符 串 类 和 列表 类 的 补充 。 

字典 类 dict 是 一 个 ( 键 ， 值 ) 对 容 需 。 查 看 字典 的 方法 之 一 是 把 它 作 为 一 个 存储 信 的 容 
高 ， 值 可 以 由 用 户 指 定 的 索引 (被 称 为 键 ) 来 访问 。 另 一 种 方法 是 将 其 视 为 从 键 到 值 的 映射 。 
字典 在 实践 中 和 列表 一 样 有 用 。 例 如 ， 字 典 奉 代 多 路 条 件 控 制 结 构 ， 或 作为 计数 硕 的 集合 。 

在 某 些 情况 下 ， 列 表 的 可 变性 是 一 个 问题 。 例 如 ， 我 们 不 能 使 用 列表 作为 字典 的 键 ， 因 
为 列表 是 可 变 对 象 。 我 们 引入 了 内 置 类 元 组 tuple， 它 本 质 上 是 类 1ist 的 不 可 变 版 本 。 
当 我 们 需要 列表 的 不 可 变 版 本 时 ， 我 们 使 用 元 组 对 象 。 

本 书 所 涵盖 的 最 后 一 个 内 置 容器 类 是 实现 数学 集合 的 类 set ， 即 支持 数学 集合 操作 的 容 
器 ， 例 如 并 和 交 。 由 于 集合 的 所 有 元 素 必 须 是 唯一 的 ， 所 以 可 以 使 用 集合 来 轻松 地 从 其 他 容 
需 中 删除 重复 的 元 和 素 。 

在 本 章 中 ， 我 们 还 完善 了 在 第 2 章 中 开始 并 在 第 4 草 继 续 进 行 的 Python 内 置 字符 串 类 
型 str 的 其 他 知识 点 。 我 们 描述 了 字符 串 对 象 可 以 包含 的 字符 范围 。 我 们 引入 Unicode 字 
符 编 码 方案 ，Unicode 是 Python 3 的 默认 字符 编码 (Python 2 则 不 是 )， 它 使 开发 人 员 能 够 处 
理 使 用 非 美 国 英 语 字 符 的 字符 串 。 

最 后 ， 本 章 介 绍 了 标准 库 模 块 random。 该 模块 支持 返回 伪 随 机 数 的 函数 ， 这 些 消 
数 对 于 仿真 和 计算 机 游戏 是 必需 的 。 我 们 还 介绍 了 random 模 块 的 图 数 shuffle()、 
choice() 和 sample()， 可 以 用 于 对 容 占 对 象 进行 混 排 和 抽样 操作 。 


6.7 练习 题 答案 


6.1 函数 带 一 个 总 统 的 姓名 (president) 作为 输入 参数 。 姓 名 映射 到 州 。 总 统 姓名 到 州 的 映射 可 以 
用 字典 来 实现 。 定 义 了 字典 之 后 ， 哺 数 下 接 返 回 对 应 于 键 president 的 值 : 
def birthState(president) : 
' 扳 回 给 定 总 统 的 出 生 州 ' 


states = {'Barack Hussein Obama II':'Hawaii', 
'George Walker Bush':'Connecticut', 
"William Jefferson Clinton' *'Arkansas 5 
'George Herbert Walker Bush':'Massachussetts', 
了 onald Wilson Reagan':'Ililinois ， 


"Janmes Karl Cartar: rr”: "Goorgia'} 


return statesl[president] 


6.2 反 向 查找 服务 是 用 无 限 的 交互 式 的 循环 模式 来 实现 的 。 在 循环 的 每 一 次 迭代 中 ， 都 要 求 用 户 输入 
一 个 电话 号 码 。 使 用 电话 禾 ， 将 用 户 输入 的 电话 号 码 映 射 到 一 个 名 称 。 然 后 输出 这 个 名 称 、 
def rlookup(phonebook): 

'， 实现 一 个 交互 式 反 向 电话 簿 查找 服务 
电话 簿 是 一 个 电话 号 码 映 射 到 名 称 的 字典 ，'' 
while True: 
number = input('Enter phone number in the\ 
format (xxx)xxx-xx-xx: ') 
if number in phonebook: 
print (phonebook [number]) 
else: 


print('The number you entered is not in use.') 
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6.3 ”参见 图 6-7: 








A A | ee pe 7 了 
Rs | 弃 'John' | 'Adam' 1 
E> 1 | 
| | 加 | 
BT 
b a | 
| J | 
pment oem ssn Poresere mane emer, ET 
ee tenting ei 
| | | | 
| 5Cindy' :1 | ‘John' 'Adam' | 
ee ei 
2 1 2 
| ; | 
Sn 
ee er a pa 
5 ‘ 
EB GLndy "john | 'Adam' || Jimm | 
| | {4 i| YY : 
Fee Ee TN TP ed 近 atte 3.9 emp PO | re 
E 
: 2 | ] 人 2 | 1 | 
| | : : i 
se cna ni A 


图 6-7 “计数 筑 状 态 。 当 遇 到 'Adam' 时 , 添加 ( 键 , 值 ) 对 ( 'Adam' ,1 ) 到 字典 。 当 遇 到 了 
mn 'Adam' 时 ， 相 同 的 ( 键 ， 值 ) 对 递增 1。 当 遇 到 字符 串 'Jimmy' 时 ， 
添加 了 男 一 个 《 键 , 值 ) 对 
6.4 首先 拆 分 文本 并 获取 单词 列表 。 然 后 使 用 字典 计数 器 的 标准 模式 。 


def wordCount (text ) : 
' 打印 文本 中 每 个 单词 的 出 现 频率 ， 


wordList = text.split() # 将 文本 拆 分 成 单词 列表 
counters = {} # 计数 器 字典 


for word in wordList: 
if word in counters: # 对 已 存在 的 单词 ,计数器 增加 1 
counters[word] += 1 
else: # 对 不 存在 的 单词 ， 计 数 器 初始 化 为 1 


counters [word] = 


for word in counters: # 打印 单词 计数 结果 (单词 出 现 频率 ) 
if counters[word] == 
print('{:8} appears {} time.'.format(word,\ 
counters [word] )) 
else: 
print('{:8} appears {} times.'.format (word,\ 
counters [word] ) ) 


6.5 无限 循环 模式 用 于 提供 长 期 运行 的 服务 。 在 每 次 迭代 中 ， 要求 用 户 输入 名 和 姓 ， 然 后 将 其 用 于 构 
建 元 组 对 象 。 该 对 象 用 作 电 话 簿 字典 的 键 。 如 果 字 上 典 包含 与 此 键 相对 应 的 值 ， 则 输出 该 值 ， 否 则 
将 输出 错误 消息 。 
def lookup(phonebook): 
''' 使 用 输入 的 电话 簿 字典 实现 交互 式 电 话 秒 '，'' 


while True: 
as 而 三 input('Enter the first riame: ‘') 
last = input ('Enter the last name: ') 


person = (first, last) # 构建 键 


if person in phonebook: # 如 果 键 位 于 电话 得 中 
print (phonebook[person]) # 打印 与 键 相对 应 的 值 
else: # 如 果 键 不 在 电话 簿 中 


print('The name you entered is not known.') 
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6.6 目标 是 获得 列表 中 出 现 的 所 有 集合 的 并 集 。 累 加 帮 模 式 是 执行 此 操作 的 正确 循环 模式 。 累 加 大 应 
该 是 一 个 被 初始 化 为 空 的 集合 : 
def sync(phonebooks): 
' 返回 电话 簿 中 所 有 集合 的 并 集 ' 
res = set() # 初始 化 累加 器 


for phonebook in phonebooks: 
res = res | phonebook # 将 电话 得 累加 到 res 中 
return res 


6.7 ”和 迭代 模式 用 于 迭代 字符 串 的 每 个 字符 。 在 每 一 次 迭代 中 ， 输 出 当前 字符 的 ASCII 人 码 : 


def encoding(text) : 
' 打印 S 中 每 个 字符 的 ASCII 码 ， 每 个 字符 占 一 行 ， 
print( ‘Char Decimal Hex Binary') # 打印 列 标 题 


or Ce in text’ 
code = ord(c) # 计算 RSCII 码 
# 打印 字符 及 其 ASCII 码 (十 进 制 、 十 六 进 制 和 二 进 制 ) 
print(' {} {:7} {:4x} {:7b}' .format(c,code,code,code)) 


6.8 我 们 使 用 计数 融和 循环 模 式 从 小 到 大 生成 整数 。 并 输出 每 个 整数 所 对 应 的 字符 : 
def char(low, high): 
''' 打印 其 ASCII 码 位 于 low 和 high 之 间 的 字符 ''' 
for i in range(low, high+1): 
# 打印 整数 ASCII 码 及 其 对 应 的 字符 
print(i{} : {}'sFormat(, chr(i}))) 


6.9 使 用 random 模块 的 randrange( ) 电 数 产生 能 用 于 猪 测 的 密码 。 使 用 一 个 无 限 循环 和 循环 折 
半 模 式 实现 交互 式 服 务 : 


import random 
def guess(n): 
' 一 个 交互 式 的 数值 猜测 游戏 ， 
secret = random.randrange(0,n)  # 生成 一 个 秘密 的 数值 


While True: 


# 用 户 输入 其 猜想 


guess = eval(input('Enter you guess: ')) 
if guess == secret: 

print('You got it!':) 

break 


elif guess < secret: 
print('Too Tow.") 

else: # guess > secret 
printl Too high. 


6.10 ”通过 在 红 围 -1 到 1 之 间 均 匀 随 机 选择 x 坐标 和 yy 坐标， 来 模拟 每 个 随机 飞镖 的 命中 点 位 置 。 如 
果 得 到 的 点 (x, 与 原点 (0,0)( 即 飞镖 靶 的 中 心 ) 的 距离 小 于 1， 则 表示 命中 。 使 用 一 个 累加 
需 循 环 模式 来 累计 “命中 ”次 数 。 
import random 
def approxPi(total): 
“通过 “投掷 飞镖 ”返回 pi 的 近似 值 ' 
count = 0 `、”# 统 计 飞 镖 命中 次 数 
for i in range(total) : 
x = random.uniform(-1,1) # 飞镖 命中 点 的 x 坐标 
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y = random.uniform(-1,1) # 飞镖 命中 点 的 y 坐标 
if Xx**2+y**2 <= 1: # 如 果 飞 镖 命 中 飞镖 邯 
count += 1 # 累加 器 count 增加 1 


return 4*count/total 


6.8 习题 
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实现 图 数 easyCrypto( )， 市 一 个 字符 串 作 为 输入 参数 ， 输 出 密 文 。 加 密 规 则 如 下 : 每 个 位 于 
字母 表 奇 数位 置 i 的 字符 加 密 为 位 置 it1 的 字符 ; 每 个 位 于 字母 表 侦 数位 置 i 的 字符 加 密 为 位 置 
i 一 1 的 字符 。 换 言 之 ,，“a” 加 密 为 “b”、“‘b” 加 密 为 “a”、‘“c” 加 密 为 “d”、“d” 加 密 为 “c”， 
以 此 类 推 。 小 写字 母 保 持 小 写 不 变 ， 大 写字 母 保持 大 写 不 变 。 
>>> easyCrypto('abc') 
bad 
>>> eaSsyCryYPto('Z00 ') 
YPP 
重新 实现 思考 题 5:27， 使 用 字典 代替 多 路 分 文 if 语句 的 方法 。 
定义 一 个 字典 agencies， 存储 缩 略 词 CCC、FCC、FDIC、SSB 和 WPA ( 键 ) 到 联邦 政府 机 
构 “ Civilian Conservation Corps”、 ”Federal Communications Commission ”、“”Federal Deposit 
Insurance Corporation ” 、“ Social Security Board ”和 “Works Progress Administration " ( 值 ) 的 映 
射 ， 这 些 机 构 由 总 统 罗 斯 福 在 新 政 期 间 创 立 。 然 后 执行 下 列 操作 : 

(a) 增加 缩 略 词 SEC 到 “Securities and Exchange Commission ”的 映射 。 

(b) 修改 键 SSB 的 值 为 “Social Security Administration ”。 

(c) 移 除 键 CCC 和 WPA 对 应 的 ( 键 , 值 ) 对 。 
重新 实现 习题 6.13， 要 求 : 修改 agencies 之 前 ,定义 一 个 键 的 视图 acronyms。 执 行 修改 操 
作 之 后 ， 对 acronyms 进行 求 值 。 
在 练习 题 6.5 中 使 用 的 字典 中 ， 假 定 一 个 人 只 可 以 有 一 个 特定 的 名 和 姓 。 然 而 ， 在 一 本 典型 的 
电话 短 中 ， 同 名 同姓 的 人 往往 不 止 一 个 。 可 以 修改 字典 ， 将 一 个 (姓氏 ， 名 字 ) 元 组 映射 到 电话 
号 码 列表 ， 从 而 实现 一 个 更 真实 的 电话 短 。 重 新 实现 练习 题 6.5 中 的 1ookup () 因数 ， 带 修改 
后 的 字典 ( 即 列表 作为 字典 的 值 ) 作为 参数 ,返回 一 个 (姓氏 ， 名 字 ) 元 组 对 应 的 所 有 电话 号 码 。 
使 用 一 个 计数 器 循环 模式 ， 构 造 三 个 集合 mult3、mult5 和 mult7， 分别 表示 小 于 100 的 3、 
5 和 7 的 倍数 。 然 后 ,使 用 这 三 个 集合 ,编写 返回 下 列 结果 的 集合 运算 表达 式 : 

(a)35 的 倍数 

(b)105 的 倍 

(c)3 或 7 的 倍数 

(d)3 或 7 (但 不 同时 ) 的 倍数 

(e)7 的 倍数 但 不 是 3 的 倍数 
编写 一 个 阴 数 hexRAscII() ， 输 出 字母 表 中 小 写字 母 及 其 对 应 的 ASCII 码 的 十 六 进 制 表 示 。 注 
意 : 格式 化 字符 串 以 及 格式 化 字符 串 方 法 可 以 用 于 输出 一 个 值 的 十 六 进 制 表示 形式 。 
>>> hexASCII() 


asol bs62 2763 d:64 6305 芋 206 ZI h:08 1:09 Jj:6a k:0b 1326c nm:6d 
ne 02 ET ql FH2 5173 E:TF4 UB FT6 WT7 X78 y:79 2:Ta 


实现 函数 coin( ) ， 按 相同 概率 返回 'Heads' 或 'Tails'。 


yD colnt) 
'Heads' 


>>> coin() 


6.19 


6.9 


6.20 


6.22 


'Heads'! 

>>> coin() 

ITails， 

使 用 在 线 翻 译 (例如 谷歌 翻译 )， 翻 译 一 句 话 “My name is Ada” 为 阿拉 伯 语 、 日 语 和 塞 尔 
维 亚 语 。 然 后 将 翻译 结果 复制 并 粘贴 到 交互 式 命 令 行 中 ， 并 将 它们 作为 字符 串 赋 值 给 变量 名 
arabic、japanese 和 serbian。 最 后 ， 对 于 每 个 字符 串 ， 使 用 友 代 循环 模式 输出 字符 串 中 
每 个 字符 的 .Unicode 代码 。 


思考 题 


编写 函数 reverse( ) ， 带 一 个 电话 短 ( 即 一 个 把 姓名 ( 键 ) 映射 到 电话 号 码 ( 值 ) 的 字典 ) 作 
为 输入 参数 。 要 求 函 数 返回 男 一 个 字典 ,表示 映射 电话 号 码 ( 键 ) 到 姓名 ( 值 ) 的 反 向 电话 短 。 
>>> phonebook = {'Smith, Jane':'123-45-67', 

'Doe, John':'987-65-43','Baker ,David':'567-89-01'} 
>>> reverse(phonebook) 
{'123-45-67'; "Smith, Jane', '567-89-01':; "Baker ,David', 
'987-65-43': 'Doe, John'} 
编写 图 数 ticker ( ) ， 训 一 个 字符 串 (文件 名 ) 作为 输入 参数 。 该 文件 将 包含 公司 名 称 和 股票 符 
号 (股票 代码 )。 在 这 个 文件 中 ,一 个 公司 名 称 将 占用 一 行 ， 其 股票 代码 将 在 下 一 行 。 接 下 来 一 
行 是 为 一 个 公司 名 称 ， 以 此 类 推 。 要 求 程 序 读 取 文 件 并 将 名 称 和 股票 代码 存储 在 字典 中 。 人 然后， 
它 将 为 用 户 提供 一 个 接口 ， 以 便 用 户 可 以 获得 给 定 公司 的 股票 代码 。 使 用 提供 的 文件 nasdaq . 
txt 中 的 纳 斯 达 克 100 股票 代码 列表 来 测试 你 的 代码 。 
>>> ticker('nasdaq.txt') 
Enter Company name: YAHOO 


Ticker Symbol: YHOO 
Enter Company name: GOOGLE INC 
Ticker symbol: GOOG 


字符 串 vow 的 镜像 字符 串 是 wov， 字 符 串 wood 的 镜像 字符 串 是 boow。 但 是 ， 字 符 串 bed 的 
镜像 不 能 表示 为 字符 串 ， 因 为 e 的 镜像 不 是 一 个 有 效 的 字符 。 

开发 痕 数 mirror()， 和 市 一 个 字符 串 作 为 输入 参数 ， 如 果 其 镜像 可 以 表示 为 字母 表 中 的 字 
母 ， 则 返回 其 镜像 字符 串 。 
>>> mirror('vow') 
>>> mirror('wood') 
'boow 
>>> mirror('bed') 
'INVALID' 
你 想 制 作 一 本 独特 的 仆 怖 字典 ， 但 想 找到 成 千 上 万 的 应 该 收入 到 该 字典 的 单词 并 不 是 件 很 容易 
的 事情 。 一 个 聪明 的 想法 是 编写 一 个 曙 数 scarydict( )， 读 入 一 本 恐怖 小 说 的 电子 版 (例如 ， 
Mary Wollstonecraft Shelley (玛丽 . 沃 斯 通 殉 拉夫 特 : 雪 莱 ) 的 Frankenstein (《 科 学 怪人 》))， 
抽取 其 中 的 所 有 单词 并 把 它们 按 字 母 顺 序 排列 写 入 到 一 个 新 的 文件 aictionary .txt， 并 输 
出 这 些 单词 。 可 以 去 掉 一 个 和 两 个 字母 的 单词 ， 因 为 这 些 单词 不 是 您 怖 单词 。 

你 会 注意 到 文本 中 的 标点 符号 使 这 个 练习 稍微 复杂 了 一 些 。 可 以 用 空格 或 空 字符 串 替 换 标 
点 符号 来 处 理 它 。 


>>> scaryDict('frankenstein.txt') 
abandon 


0.24 


0.23 


6.206 


O27 


和 
As 
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明 
路 


abandoned 
abbey 
abhor 
abhorred 
abhorrence 
abhorrent 


实现 函数 names ( ) ， 不 市 任何 输入 参数 ,重复 要 求 用 户 输入 一 个 班级 的 学 生 姓 名 。 当 用 户 输入 
空 字 符 串 时 ， 顺 数 输出 每 个 姓名 及 该 姓名 的 学 生 数 量 。 


>>> names() 

Enter next name: Valerie 

Enter next name: Bob 

Enter next name: Valerie 

Enter next name: Amelia 

Enter next name: Bob 

Enter next name: 

There is 1 student named Amelia 
There are 2 students named Bob 
There are 2 students named Valerie 


编写 图 数 different()， 和 市 一 个 二 维 表 作为 输入 参数 ， 返 回 表 中 不 同 项 的 数量 。 


-> WR 

>>> difféerent (t) 

总 

S53 = [3242 52.63] 2. 64.67 62] [64 84, 4147.34], [34,.17.76.98]] 
>>> different (t) 

10 


编写 函数 week()， 不 带 任 何 输入 参数 。 抑 数 重复 请 求 用 户 输入 星期 的 缩写 (Mo、Tu、We、 
Th、Fr、Sa 或 Su)， 然 后 输出 对 应 的 星期 名 称 。 

>>> week() 

Enter day abbreviation: Tu 

Tuesday 

Enter day abbreviation: Su 

Sunday 

Enter day abbreviation: Sa 


Saturday 
Enter day abbreviation: 


在 本 书 和 其 他 教科 书 的 结尾 ， 通 常 有 一 个 索引 ， 列 出 某 个 词 出 现 的 页 面 。 在 本 题 中 ， 要 求 为 文 
本 创建 索引 ， 但 不 使 用 页 码 ， 而 是 使 用 行 号 。 

请 实现 函数 index( ) ， 带 两 个 输入 参数 : 一 个 文本 文件 的 文件 名 和 一 个 单词 列表 。 对 于 列 
表 中 的 每 个 单词 ， 男 数 将 在 文本 文件 中 找到 单词 出 现 的 行 ， 并 打印 相应 的 行 号 (编号 从 1 开始 )。 
要 求 只 打开 和 读 取 文件 一 次 。 


>>> index('raven.txt', ['raven’ ， ortal’s "dying"s "Ehost'";, 








"hastly nevil', "demon' ]) 
ghost 9 
dying 9 
demon 12% 
evil 99，106 
ghastly 82 


mortal 30 
raven 44. .63,, SB, G4, Fe 97, L104 dd 二， 120 
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6.28 


0:29 


6.31 


6.32 


第 6 恒 


实现 也 数 translate( )， 提供 基 本 的 翻译 服务 。 也 数 的 输入 参数 是 一 个 把 一 种 语言 (第 一 种 
语言 ) 中 的 单词 映射 到 男 一 种 语言 (第 二 种 语言 ) 中 的 对 应 词 的 字典 。 该 限 数 提供 了 一 种 服务 ， 
允许 用 户 交互 地 输入 第 一 语言 中 的 一 个 短语 ， 然 后 通过 按 【 回 车 键 】 获 取 到 第 二 语言 中 的 翻译 。 
在 字典 里 不 存在 的 词 翻译 成 
在 班级 中 ,许多 学 生 是 朋友 。 让 我 们 假设 两 个 学 生 共 有 一 个 朋友 ， 则 他 们 俩 也 是 朋友 。 换 句 话 
说 ， 如 果 学 生 0 和 学 生 1 是 朋友 ， 学 生 1 和 学 生 2 是 朋友 ， 那么 学 生 0 和 学 生 2 必须 是 朋友 。 
利用 这 条 规则 ， 我 们 可 以 把 学 生 分 成 朋友 圈子 。 

要 完成 该 工作 ， 实 现 阴 数 networks ( ) ， 融 两 个 输入 参数 。 第 一 个 参数 是 班 上 学 生 的 总 人 
数 n。 我 们 假设 学 生 使 用 整数 0 到 n -1 来 标识 。 第 二 个 输入 参数 是 定义 朋友 的 元 组 对 象 列表 。 
例如 ， 元 组 (0，2) 将 学 生 0 和 学 生 2 定义 为 朋友 。 要 求 函 数 networks() 输出 学 生 的 朋友 圈 ， 
如 下 所 示 : 
SO DotUNOrES(CB, [L(tQ. 1),. YL 2 《3 


Social netwvork 0 is {0, 1, 2+ 
Social network 1 is {3, 4} 


实现 函数 simul()， 带 一 个 整数 n 作为 输入 参数 。 模 拟 玩家 1 和 玩家 2 之 间 的 n 轮 石 涉 、 前 
刀 、 布 游戏 。 万 得 次 数 最 多 的 玩家 万 得 这 轮 游戏 也 有 可 能 平局 。 要 求 函 数 输出 如 下 所 示 的 游 
戏 结果 。( 可 以 使 用 思考 题 5.26 的 解决 方案 )。 

>>> simul(1) 

Player 1 

>>> simul(1) 

Tie 

>>> simul (100) 

Player 2 


双 货 儿 赌 博 是 在 许多 赌场 玩 的 掷 货 子 游 戏 。 像 二 十 一 点 扑克 牌 游 戏 一 样 ， 玩 家 和 赌场 比 输 启 。 
游戏 开始 时 ， 玩 家 投掷 一 对 标准 的 6 面 仍 子 。 如 果 玩 家 总 共 掷 出 7 点 或 11 点 ， 则 玩家 获胜 。 如 
果 玩 家 总 共 掷 出 2 点 、3 点 或 者 12 点 ， 则 玩家 输 。 如 条 是 其 他 点 数 ， 则 玩家 将 重复 掷 一 对 假 子 ， 
直到 她 再 次 掷 出 开始 的 点 数 (在 这 种 情况 下 她 最 ) 或 7 (在 这 种 情况 下 ， 她 输 )。 

(a) 实现 师 数 craps ( ) ， 不 带 任 何 输入 参数 ， 模 拟 双 货 儿 赌 博 游戏 ， 如 果 玩 家 赢 ， 则 输出 
1; 如 果 玩 家 输 ， 则 输出 0。 
>>> craps() 
0 
>>> craps() 
1 


>>> craps() 
1 


(b) 实现 函数 testCraps( ) ， 市 一 个 正 整数 款 作 为 输入 参数 。 模 拟 严 次 双 货 儿 赌 博 游戏 ， 
返回 玩家 胜出 的 比率 。 
>>> testCraps (10000) 
0.4844 
>>> testCraps (10000) 
0.492 
你 可 能 知道 曼哈顿 的 大 街 小 巷 构 成 一 个 网 格 。 通 过 网 格 ( 即 曼 哈 顿 ) 的 随机 漫步 是 指 在 每 个 交叉 
点 以 相等 的 概率 选择 随机 方向 (N、E、S 或 W) 的 行走 。 例 如 , 在 Sx1ll 的 网 格 上 ， 从 (5，2) 
开始 的 随机 行走 可 以 访问 网 格 点 (6，2)、(7，2)、(9，2)、(8，2) 和 (10，2)， 返 回 到 (9，2)， 然 
后 在 离开 网 格 之 前 返回 到 (10，2)。 


0.34 


0.35 
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编写 函数 manhattan( ) ， 带 两 个 输入 参数 : 网 格 的 行 数 和 列 数 ， 模 拟 从 网 格 中 心 出 发 的 
一 次 随机 游 走 ， 计 算 随 机 漫步 访问 每 个 交叉 点 的 次 数 。 当 随机 游 走 超出 网 格外 ， 则 函数 逐 行 输 
出 结果 。 


>>> manhattan(5, 11) 


LO 0D Dy Os D: By Ds Q OW 
| 
Ws GO Ds We 0 4 Ls 
0 Se Se «Po 
和 


编写 限 数 diceprob ( ) ， 带 一 个 输入 参数 : 投掷 一 对 骨 子 的 可 能 结果 > ( 即 2 到 12 范围 内 的 一 
个 整数 )。 模 拟 投 撕 一 对 角 子 ， 直 到 获得 100 次 结果 r。 要 求 函 数 输出 获得 100 次 结果 > 的 投掷 
次 数 。 

>>> diceprob(2) 

It took 4007 rolls to get 100 rolls of 2 

>>> diceprob(3) 

lt took 1762 roils to get 100 rolls of 3 

>>> diceprob(4) 

[It took 1058 rolls to get 100 rolls of 4 

>>> diceprob(5) 

lt took 1075 rolls to get 100 rolls of 5 

>>> diceprob(6) 

lt Took 60 rolls to get i100 rolls of 吉 

>>> diceprob(7) 

lt took 560 rolls to get 100 rolls of 7 


两 人 纸牌 游戏 War (战争 ) 使 用 52 张 牌 的 标准 套 牌 。 一 副 洗 好 的 牌 均匀 分 配给 两 个 玩家 ， 各 和 目 
的 牌 面 绷 下。 该 游戏 包括 一 系列 的 比 斗 ， 直 到 一 个 玩家 用 完 纸 牌 为 止 。 在 一 次 比 斗 中 ， 每 个 玩 
家 展示 其 最 上 面 的 纸牌 ， 牌 大 的 玩家 将 拿 走 赢得 的 两 张 牌 ， 并 把 它们 正面 朝 下 放 到 她 的 牌 堆 底 
部 。 如 果 两 张 牌 值 相同 ， 就 会 发 生 一 场 战 争 。 

在 一 场 战 争 中 ， 每 一 个 玩家 都 会 面 朝 下 放置 其 牌 推 最 上 面 的 三 张 牌 ， 并 选择 其 中 一 张 牌 。 
所 选 牌 大 的 玩家 将 所 有 八 张 牌 加 到 她 的 牌 推 底部。 如果 是 另 一 个 平局 ， 则 重复 战争 ， 直 到 一 个 
玩家 启 了 ， 将 牌 更 上 的 所 有 牌 纳 为 已 有 。 在 一 场 战 争 中 ， 如 果 有 一 个 玩家 在 放置 三 张 牌 之 前 就 
用 完了 所 有 的 牌 ， 他 就 可 以 用 他 的 最 后 一 张 牌 来 万 得 这 场 战争 。 

在 战争 中 ,纸牌 的 大 小 值 是 它 的 等 级 ,纸牌 A、K、Q 和 J 的 值 分 别 为 14、13、12 和 11， 

(a) 编写 一 个 困 数 war()， 模 拟 一 次 战争 游戏 ， 并 返回 一 个 元 组 ， 该 元 组 包含 游戏 中 比 斗 
的 次 数 、 战 争 次 数 、 两 轮 战 争 的 次 数 。 注 意 : 在 玩家 的 纸牌 下 添加 纸牌 时 ， 一 定 要 先 洗 牌 ， 以 
增加 模拟 的 随机 性 。 

(b) 编写 一 个 果 数 warStats0)， 率 一 个 正 整 数 款 作为 输入 参数 。 模 拟 产 次 战争 游戏 ， 计 算 平 
均 比 斗 次 数 、 战 争 次 数 、 两 轮 战争 的 次 数 。 
开发 一 个 简单 的 游戏 ， 教 幼儿 园 孩 子 学 习 个 位 数 加 法 运算 。 孔 数 game( ) 带 一 个 整数 n 作为 
输入 参数 ,然后 提问 nn 个 个 位 数 加 法 问题 。 要 求 参 与 加 法 运算 的 数字 从 范围 [0，9] ( 即 0 到 
9， 包 含 0 和 9) 随机 选择 。 当 问题 提出 后 ， 用 户 将 输入 答案 。 如 果 答 案 正 确 ， 则 函数 输出 
“Correct”， 答 案 错 误 则 输出 “Incorrect”。 完 成 于 次 提问 后 ， 要 求 函 数 输出 答案 正确 的 
次 数 : 
>>> game(3) 
中 本 六 本 


Enter answer: 10 
GOrrect. 
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6 未 了 三 

Enter answer: 12 

Incorrect. 

Enter answer: 14 

Correct. 

You got 2 correct answers out of 3 


已 撤 密 码 是 一 种 加 密 技 术 ， 在 该 技术 中 ， 消 息 中 的 每 一 个 字母 都 由 字母 表 上 疝 后 偏 移 固定 数值 
位 置 的 字母 代替 。 这 个 “固定 数 ” 被 称 为 密 钥 ， 它 的 值 从 1 到 25。 例 如 ， 如 果 密 钥 为 4， 则 A 
字母 将 由 E、B 由 F、C 由 G 替换 ， 以 此 类 推 。 字 母 表 尾部 的 字符 W、X、Y 和 Z 将 被 A、B、 
C 和 D 替换 。 

编写 限 数 caesar ( ) ， 带 两 个 参数 : 一 个 1 到 25 范围 之 间 的 密 钥 和 一 个 文本 文件 的 文件 名 
(字符 串 )。 要 求 函 数 使 用 输入 密 钥 把 文件 内 容 通 过 恺 撒 密码 加 密 算 法 进行 加 密 ， 并 把 加 密 后 的 
内 容 写 入 到 一 个 新 的 文件 cipher .txt 中 ， 同 时 返回 加 密 内 容 。 
>>> caesar(3, 'clear .txt') 


"Vsb Pdqxdo (Wrs vhfuhw)\n\ni. Dozdbv zhdu d gdun frdw.\n2. Dozdbv 
Zhduy DrFX jhqfb'v edgjh rd brxu frdvw. AI 


乔治 . 金 斯 利 . 齐 夫 (George Kingsley Zipf) ( 1902-1950 ) 观察 到 一 篇 文章 中 第 个 最 常见 单词 
的 频率 约 正 比 于 1/k。 这 意味 着 存在 一 个 常量 值 C， 对 于 文章 中 的 大 多 数 的 单词 w， 下 列 关 系 式 
成 立 : 
如 果 w 是 第 个 最 常见 的 单词 ， 则 freq(w)*k 守 CC 
这 里 ，freq(w) 是 指 单词 w 的 频率 ， 即 单词 w 在 文章 中 出 现 的 次 数 除 以 文章 中 单词 的 总 数 。 
实现 函数 zipf()， 带 一 个 文件 名 作为 输入 参数 。 通 过 输出 文件 中 10 个 最 高 频 单词 w 的 
freq(w) :大 值 ， 来 验证 齐 夫 观 察 结果 的 正确 性 。 处 理 文 件 时 请 忽略 大 小 写 和 标点 符号 。 


>>> Zipf('frankenstein .txt ') 
-0557319552019 
.0790477076165 
113270715149 
.140452498306 
.139097394747 
.141648177917 
.129359248582 
.119993091629 
.122078888284 
.134978942754 


一 
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名 称 空 间 





本 章 将 名 称 空间 作为 管理 程序 复杂 性 的 基本 结构 。 随 着 计算 机 程序 复杂 性 的 增加 ， 有 必 
要 采用 模块 化 的 方法 ， 并 使 用 奉 干 较 小 的 组 件 进行 开发 、 测 试 和 调试 。 这 些 组 件 无 论 是 消 
数 、 模 块 还 是 类 ， 都 必须 作为 一 个 程序 协同 工作 ， 且 它们 不 应 该 相互 干扰 (以 非 允 许 方式 )。 

由 于 每 个 组 件 都 有 自己 的 名 称 空间 ， 所 以 模块 化 和 “ 非 干 扰 ”( 通 第 称 为 封 滩 ) 才 成 为 可 
能 。 名 称 空间 在 函数 、 模 块 和 类 中 组 织 命 名 方案 ， 以 便 在 组 件 中 定义 的 名 称 对 其 他 组 件 不 可 
见 。 名 称 空间 在 函数 调用 的 执行 和 程序 的 正常 控制 流 中 起 着 关键 的 作用 。 我 们 将 此 与 由 异 稼 
引发 的 异常 控制 流 进行 对 比 。 我 们 引入 异常 处 理 作为 控制 该 控制 流 的 一 种 方法 。 

本 章 涵盖 程序 设计 的 基本 概念 和 技术 。 我 们 在 第 8 间 中 应 用 它们 来 创建 新 类 ， 并 在 第 
10 草 中 了 解 递归 函数 是 如 何 执 行 的 。 


7.1 函数 封装 


在 第 3 章 中 ， 我 们 介绍 了 因数 ， 用 于 封装 代码 片段 。 回 顾 把 代码 封 交 为 吨 数 来 调用 的 理 
由 ， 我 们 以 案例 研究 CS.3 中 的 函数 jump ( ) 为 例 : 


模块 : turtlefunctions.py 


t ‘def Jimp(b, XR, Y): 
' 让 海龟 跳 转 到 坐标 (X，y) ， 
t.penup() 
站 ,006 到 
七 .pendown() 


轴 数 jump() 提供 了 一 个 简洁 的 方法 ， 使 得 海 包 对 象 t( 即 画笔 ) 移动 到 一 个 新 的 位 置 
(在 绘画 表面 ) 而 不 留 痕迹 。 在 3 间 中 ， 我 们 在 画 一 个 笑脸 的 函数 emoticon() 中 多 次 调用 
了 jump( ) 哺 数 : 





模块 : turtlefunctions.py 


1 ‘def emoticon(t, x, y): 


' 指示 海龟 七 在 (x, y) 位 置 绘 制 一 个 有 下 书 的 笑脸 ，' 


t.pensize(3) # 设置 海龟 朝向 和 笔 大 小 
t.setheading(0) 
Timp(t, KE， # 移动 到 (x，Y)， 并 绘制 头 部 


t.circLle(100) 

jump(t，x+35,，y+120)  ”# 移 动 并 绘制 右 眼 
tadot(25) 

jump(t，x-35，y+120)  ”# 移 动 并 绘制 左 眼 
t.Ad0t(25) 

jump( 七 ，x-60.62，Yy+65) # 移 动 并 绘制 笑脸 
t.setheading(-60) 

teirela(t7TO0 120) # 圆 的 120 度 部 分 
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困 数 jump () 和 emoticon() 展示 孔 数 的 一 些 优越 性 : 代码 重用 、 封 装 和 模块 化 。 接 
下 来 将 一 一 详细 阐述 。 


7.1.1 代码 重用 

在 一 个 或 多 个 程序 中 多 次 使 用 的 一 段 代码 可 以 封装 在 一 个 滑 数 中 。 这 样 ， 程 序 员 只 在 水 
数 定 义 内 键入 代码 片段 一 次 ， 然 后 在 需要 代码 片段 的 地 方 调用 晒 数 。 结 果 程 序 会 变 得 精简 
(通过 一 个 因数 调用 蔡 换 代码 片段 ) 和 清晰 〈 因 为 图 数 的 名 称 可 以 更 准确 地 描述 代码 片段 正在 
执行 的 操作 )。 调 试 也 变 得 更 容易 ， 因 为 代码 片段 中 的 错误 只 需要 修复 一 次 。 

在 限 数 emoticon() 中 ， 我 们 使 用 了 四 次 图 数 jump ( ) ， 结 果 使 得 emoticon( ) 函数 
更 加 短小 且 更 具 可 读 性 。 这 也 使 程序 更 容易 修改 : 任何 修改 跳 转 的 操作 只 需要 在 jump ( ) 中 
修改 一 次 。 事 实 上， 因数 emoticon( ) 甚至 不 需要 修改 。 

我 们 在 案例 研究 CS.6 中 看 到 了 另 一 个 代码 重用 的 示例 。CS.6 开发 了 一 个 二 十 一 点 扑克 
牌 游戏 应 用 程序 。 因 为 一 副 标 准 52 张 扑克 有 牌 的 洗 牌 和 给 游戏 参与 者 发 牌 是 纸牌 游戏 中 常用 
的 操作 ， 因 此 我 们 把 洗 牌 和 发 牌 动 作 实现 为 独立 的 、 可 重用 的 函数 (shuffledpDeck() 和 
dealCard( ) )。 


7.1.2 ”模块 化 

开发 大 型 程序 的 复 森 性 可 以 通过 将 程序 分 解 成 更 小 、 更 简单、 功能 独立 的 部 件 来 解决 。 
每 个 较 小 的 部 分 (例如 函数 ) 可 以 独立 地 设计 、 实 现 、 测 试 和 调试 。 

例如 ， 我 们 把 绘制 突 脸 的 问题 分 解 为 两 个 图 数 。 轴 数 jump( ) 独立 于 困 数 emoticon( )， 
可 以 独立 测试 和 调试 。 一 旦 函数 jump( ) 开发 完毕 ， 函 数 emoticon( ) 就 更 容 匈 实现 。 我 们 还 
在 案例 研究 CS.6 中 使 用 模块 化 的 方法 ， 使 用 了 五 个 困 数 开发 了 二 十 一 点 扑 殉 牌 游戏 应 用 程序 。 


7.1.3 封装 

当 在 程序 中 使 用 因数 时 ， 开 发 人 员 通 篆 不 需要 知道 它 的 实现 细节 ， 而 只 需要 知道 它 做 了 
什么 。 事 实 上， 从 开发 人 员 的 角度 而 言 ， 删 除 实现 细节 反而 使 工作 更 容易 。 

明 数 emoticon( ) 的 开发 人 员 不 需要 知道 遇 数 jump( ) 的 工作 上 原理， 只 需要 知道 它 把 
海 包 ( 即 画 笔 ) 抬 起 并 落下 到 坐标 (Kg， 妇 即 可 。 这 催化 了 开发 辆 数 emoticon() 的 过 程 。 
封 荫 的 另 一 个 好 处 是 ， 如 果 函 数 jump( ) 的 实现 发 生 了 变化 (例如 更 有 效 的 改进 版 )， 需 数 
emoticon( ) 无 须 修 改 。 

在 二 十 一 点 扑克 牌 游戏 应 用 程序 中 ， 洗 牌 辆 数 和 计算 手 牌 的 点 数 果 数 封 朔 了 执行 实际 工 
作 的 代码 。 其 优越 性 在 于 二 十 一 点 扑 死 牌 游戏 的 主 程序 包含 有 意义 的 困 数 调用 ， 例 如 


deck = shuffledDeck() # 获得 洗 好 的 牌 
和 
dealCard(deck, player) # 给 选手 发 牌 


而 不 是 难以 读 民 的 代码。 


7.1.4 局 部 变量 


当 开 发 人 员 调 用 一 个 涌 数 但 不 知道 其 实现 细节 时 ， 存 在 一 个 潜在 的 危险 。 如 果 在 某 种 程 
度 上 ， 顶 数 的 执行 不 经 意 地 影响 了 调用 程序 ( 即 发 出 师 数 调用 的 程序 )， 结 采 会 如 何 呢 ? 例 
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如 ， 开 发 人 员 可 能 在 调用 程序 中 意外 地 使 用 一 个 变量 名 称 ， 而 这 个 变量 名 称 恰 好 是 在 执行 的 
明 数 中 定义 和 使 用 。 为 了 实现 封装 ， 这 两 个 变量 应 该 是 分 开 的 。 函 数 中 定义 〈 即 赋值 ) 的 变 
量 名 应 该 对 调用 程序 是 “不 可 见 的 ”: 它们 应 该 是 在 函数 执行 的 上 下 文中 只 存在 于 本 地 的 变 
量 ， 它 们 不 应 该 影响 调用 程序 中 同名 的 变量 。 由 于 清 数 中 定义 的 变量 是 局 部 变量 ， 所 以 实现 
了 这 种 不 可 见 性 。 

我 们 使 用 如 下 函数 说 明了 这 一 点 : 


模块 : ch7.py 


def double(y) : 
X=2 
print ("x = {}, y = {}' -format (x,y)) 
return x*y 





运行 模块 ch7 之 后 ， 我 们 检查 在 解释 硕 命 令 行 中 没有 定义 名 称 x 和 Yy: 


> 区 
Traceback (most recent call last): 
File "<pyshell#37>", lJine 1, in <module> 
并 
NameError: name 'x' is not defined 
> 了 


Traceback (most recent call last): 
File "<pyshell#383'", line 1, in <module> 


1 
NameError: name 'y' is not defined 


接 下 来 我 们 调用 执行 国 数 double(): 

>>> res = double(3) 

总 

在 阴 数 执行 过 程 中 ， 变 量 x 和 y 存在 : y 被 赋值 为 3， 然 后 x 被 赋值 为 2。 然 而 ， 调 用 
执行 该 图 数 之 后 ， 在 解释 需 命 令 行 中 不 存在 名 称 x 和 Yy: 


> 区 
Traceback (most recent call last): 
File "<pysheili#40>", line 1, in <module> 
式 
NameError: name 'x' is not defined 
>>> y 


Traceback (most Tecent call last): 
File "<pyshell#41>", line 1, in <module> 


NameError: name 'y' is not defined 


很 显然 , xx 和 yy 仅仅 在 函数 执行 过 程 中 存在 。 
7.1.5 与 函数 调用 相关 的 名 称 空 间 


实际 上 ， 更 彻底 的 事实 是 : 在 aouble() 执行 过 程 中 定义 了 的 变量 名 x 和 y 对 调用 程 
序 (在 我 们 的 例子 中 ， 是 解释 紫 命 令 行 ) 不 可 见 ， 即 使 在 函数 执行 过 程 中 也 是 如 此 。 为 了 证 
明 这 一 点 ， 让 我 们 在 命令 行 中 定义 变量 x 和 y， 然 后 再 执行 函数 double( ): 


2 这 订 20,30 
>>> res double(4) 
区 一 之 了 本 


| 二 有 | 
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让 我 们 检查 变量 x 和 y (在 解释 需 命 令 行 中 定义 ) 是 否 被 更 改 : 

SS uy 

(20 ，30) 

变量 x 和 Yy 没有 被 更 改 。 该 示例 表明 存在 两 组 不 同 的 变量 名 x 和 Yy : 在 解释 硕 命 令 行 中 定 
义 的 一 组 变量 和 在 函数 执行 过 程 中 定义 的 另 一 组 变量 。 图 7-1 显示 了 解释 硕 命 令 行 和 执行 中 的 部 
数 各 目 具 有 独立 的 名 称 空间 。 每 个 空间 被 称 为 名 称 空间 。 解 释 需 命令 行 有 目 己 的 名 称 空间 。 每 
次 图 数 调用 将 会 创建 一 个 新 的 名 称 空间 。 不 同 的 果 数 调用 具有 各 自 不 同 的 相对 应 的 名 称 空间 。 
其 效果 是 每 个 困 数 调用 都 有 上 自己 的 “执行 区 域 "， 所 以 它 不 会 干扰 调用 程序 或 其 他 函数 的 执行 。 








图 7-1 名 称 空间 。 变 量 名 x 和 y 在 解释 禹 命令 行 中 定义 。 在 double(4) 执行 过 程 中 ,在 哨 
oO X 和 Y 


在 执行 果 数 调用 时 分 配 的 名 称 被 称 为 本 地 名 称 ， 它 们 是 郧 数 调用 中 的 局 部 名 称 。 轴 数 的 
局 部 名 称 只 存在 于 与 果 数 调用 相关 的 名 称 空 间 中 。 它 们 具有 如 下 特点 : 
e 仅 对 函数 中 的 代码 可 见 。 
e 不 会 影响 函数 以 外 定义 的 名 称 ， 即 使 它们 名 称 相同 。 
e 仅 在 函数 执行 期 间 存 在 。 在 函数 开始 执行 之 前 不 存在 ， 并 且 在 函数 完成 执行 后 也 不 
再 存在 。 
定义 函数 E() 和 gf() 如 下 : 


>>> def f(y): 


X=2 

print('Ta £f(): 3 = {}, y = {}' .format(x,y)) 
g(3) 

prinpt("In YY 


>>> def g(y): 
x= 4 
print('In g&(): x = {}, y = {}" .format(xsy)) 
使 用 图 7-1 作为 范例 ， 图 形 化 地 描述 使 用 如 下 调用 执行 函数 g( ) 时 ,总数 f() 和 gl() 
的 变量 名 、 变 量 的 值 和 名 称 空 间 。 


>> fC1Y 


7.1.6 ”名 称 空 间 与 程序 栈 

我 们 知道 每 个 函数 调用 将 创建 一 个 新 的 名 称 空间 。 如 果 我 们 调用 一 个 函数 ， 该 函数 又 调 
用 第 二 个 函数 ， 第 二 个 函数 又 调用 第 三 个 函数 ， 则 将 有 三 个 名 称 空间 ， 对 应 于 每 一 个 函数 的 
调用 。 我 们 现在 讨论 操作 系统 ( OS) 如 何 管理 这 些 名 称 空间 。 这 一 点 很 重要 ， 因 为 没有 操作 






调用 g(3) 创建 一 个 新 的 名 称 空间 ， 其 中 n 
行 。 盟 数 调用 h(2) 创建 一 个 新 的 名 称 空 
值 (2) 执行 


于 3。 当 g(3) 终止 后 ,恢复 执行 £(4)】 


。 当 h(2) 执行 终止 后 ,恢复 执行 g(3) 及 其 对 应 的 名 称 空 
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系统 对 管理 名 称 空间 的 支持 ， 就 无 法 实现 函数 调用 ， 
我 们 使 用 如 下 模块 作为 运行 示例 : 
模块 : stack.py 
def h(n): 
print ("Start hn') 
Brin (1/2 
print (n) 
def g(n): 
print("Start Br’) 
h(n-1) 
print (n) 
def £(n). 
print ("Start 下 1 
gl(n-1) 
Brint (ny 
运行 该 模块 之 后 ， 我 们 在 命令 行 执 行 函 数 调用 £(4): 
>>> f(4) 
Start + 
Stazt g 
Start h 
Q.5 
2 
3 
4 
图 7-2 描述 了 f£(4) 的 执行 过 程 : 
运行 f (4) 
ppt eM Te 
g(n-1) ] ~ 
二 n= 3 运行 ho 
| “Start gg 
h(n-1) 
printk "Start Hi') 
print (1/n) 
print (n) 
ee print (n) 
| “SS 
print (n) ] ed 返回 至 z(3) 
返回 至 f (4) 
图 7-2 f(4) 的 执行 过 程 。 eer tg pe i 


各 Pee hn ent be 
-J cb 亲 数 h( ) 使 用 n 的 这 
| 日 ， pd 


网 7-2 显示 了 了 三 个 不 同 的 名 称 空间 以 及 其 中 每 个 nm 的 不 同 值 。 为 了 理解 这 些 名 称 空间 是 
如 何 管理 的 ， 我 们 仔细 研究 E(4) 的 执行 计 各 。 

当 开 始 执 行 £(4) 时 ,n 的 值 是 4。 当 调用 函数 g(3) 时， 函数 调用 g(3) 对 应 的 名 称 
空间 中 的 值 是 3。 然 而 ， n 的 旧 值 4 必须 保留 ， 因为 £(4) 的 执行 还 没有 完成 。 当 g(3) 
结束 后 ， 必 须 继续 执行 第 14 行 的 代码 。 

在 g(3) 执行 开始 之 前 ， 底 层 的 OS 存储 要 完成 £(4) 的 执行 所 需要 的 所 有 信息 : 

e 变量 n 的 值 (在 示例 中 ， 值 n=4 ) 

e 恢复 继续 执行 (4) 的 代码 行 号 (在 本 实例 中 ， 为 第 14 行 ) 

OS 把 这 些 信息 保存 在 被 称 为 程序 栈 的 内 存 中 。 它 被 称 为 栈 ， 因 为 操作 系统 会 在 执行 
g (3) 之 前 将 信息 压 入 到 程序 栈 的 顶部 。 如 图 7-3 所 示 。 


| fl(4) 的 栈 顶 


得 序 栈 
图 7-3” 栈 帧 。 一 个 函数 调用 把 局 部 变量 存储 在 其 栈 帧 。 如 果 调 用 另 一 个 函数 ， 则 也 保存 下 一 


次 执行 的 行 号 
存储 与 特定 未 完成 函数 调用 相关 的 信息 的 程序 栈 区 域 称 为 栈 帧 。 
当 开 始 执 行 函数 调用 g(3),n 的 值 是 3。 在 g(3) 的 执行 过 程 中 ,使 用 输入 参数 n-1 
=2 调用 师 数 h()。 调 用 困 数 hl() 之 前 ， 对 应 于 g(3) 的 栈 帧 被 压 人 到 程序 栈 ， 如 图 7-4 


所 未 。 


14 行 
:i 
程序 栈 
岗 7-4 程序 栈 。 如 来 一 个 孔 数 在 男 一 个 函数 中 被 调用 ， 则 被 调用 的 函数 的 栈 帧 被 压 入 到 调用 
方 的 函数 的 栈 帧 之 上 





} se 的 栈 帧 


在 图 7-5 中 ,我们 下 次 描述 函数 £(4) 的 执行 过 程 ， 这 次 同时 显示 OS 如 何 使 用 程序 栈 
来 存储 未 完成 函数 调用 的 名 称 空间 ， 以 便当 继续 函数 调用 执行 时 恢复 名 称 空间 。 在 图 7-5 的 
上 半 邵 分 ， 函 数 调 用 系列 使 用 实 线 箭 头 描 述 。 每 次 调用 对 应 一 次 “ 压 人 ” 栈 帧 到 程序 栈 的 操 
作 ， 在 网 中 使 用 虚线 箭头 表示 。 

现在 ， 让 我 们 继续 仔细 分 析 E(4) 的 执行 过 程 。 当 h(2) 执行 时 ，n 是 2， 并 输出 In = 
0.5 和 n= 2。 然 后 h(2) 终止 执行 。 此 时 ， 执行 控制 将 返回 到 函数 调用 g(3)。 因 此 ， 需 
恢复 与 g(3) 相关 联 的 名 称 空间 ， 继 续 上 一 次 停止 执行 的 位 置 。OS 将 通过 从 程序 栈 顶 部 弹 
上 术 巅 。 并 使 用 本 由 的 值 执行 如 下 操作 ; 

。 恢复 n 的 值 为 3 ( 即 恢复 名 称 空间 ) 。 

e 从 第 9 行 开始 继续 执行 g (3 )。 
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图 7-5 E(4) 的 执行 过 程 ， 第 2 部分。 因数 调用 f(4) 在 自己 的 名 称 空间 执行 。 当 调用 g(3) 
时 ，Ef(4) 的 名 称 空间 被 压 入 到 程序 栈 。 响 数 调用 g(3) 在 自己 的 名 称 空间 执行 。 当 调 
用 h(2) 时 ，g(3) 的 名 称 空间 也 被 压 人 到 程序 栈 。 当 图 数 调用 h(2) 终止 时 ， 通 过 弹 
出 程序 栈 的 顶部 栈 帧 恢复 g(3) 的 名 称 空间 ， 从 存储 在 栈 帧 中 的 行 ( 即 第 9 行 ) 开始 继 
续 执行 。 当 g(3) 终止 时 ， 再 次 通过 阐 出 程序 栈 恢复 E(4) 的 名 称 空间 和 执行 


执行 第 9 行 ， 结 果 为 输出 ma = 3， 并 终止 g(3)。 如 图 7-5 所 示 ， 程 序 栈 继续 弹出 并 恢复 天 
数 调用 £(4) 的 名 称 空 间 ， 并 从 第 14 行 开 始 继续 执行 E(4) 。 结 果 是 输出 mn=4， 并 终止 f(4)。 


知识 拓展 : 程序 栈 和 缓冲 区 溢出 攻击 

程序 栈 是 操作 系统 主 存 的 重要 组 成 部 分 。 程 序 栈 为 每 个 函数 调用 包含 一 个 栈 帧 。 栈 帧 
用 于 存储 与 函数 调用 有 关 的 本 地 变量 (如 n)。 男 外 ， 当 调用 另 一 个 函数 时 ， 栈 帧 用 于 存 
储 当 其 他 函数 终止 后 恢复 执行 的 指令 的 行 号 ( 即 内 存 地 址 )。 

程序 栈 还 给 计算 机 系统 带 来 一 个 漏洞 ， 这 种 漏洞 常常 用 于 计算 机 系统 攻击 ,被 称 为 缓 
冲 区 溢出 攻击 。 该 漏洞 在 于 ,函数 调用 的 输入 参数 ,例如 ££(4) 中 的 4， 可 以 写 入 程序 栈 
中 ， 如 图 7-5 所 示 。 换 言 之 ,操作 系统 在 程序 栈 中 分 配 一 个 小 的 空间 来 存储 预期 的 输入 参 
数 《在 我 们 的 例子 中 是 一 个 整数 值 )。 

恶意 用 户 可 以 用 比分 配 空间 大 得 多 的 参数 调用 函数 。 这 种 参数 可 能 包含 恶意 代码 ， 也 
会 把 程序 栈 中 的 既 存 行 号 覆盖 为 另 一 个 行 号 。 当 然 这 一 新 的 行 号 将 指向 恶意 代 

最 终 ， 执 行程 序 将 弹出 包含 重 写 行 号 的 栈 帧 ， 并 开始 执行 从 该 行 开 始 的 指令 。 


7.2 全 局 名 称 空间 和 局 部 名 称 空 间 


我 们 已 经 看 到 ， 每 个 函数 调用 部 有 一 个 与 它 相 关联 的 名 称 空间 。 名 称 空间 是 在 消 数 执行 
过 程 中 定义 的 名 称 存在 空间 。 也 就 是 说 ,这 些 名 称 的 作用 范围 ( 即 它们 所 生存 的 空间 ) 是 隔 
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数 调 用 的 名 称 空间 。 

在 Python 程序 中 ， 每 一 个 名 称 (不 管 是 变量 名 、 郴 数 名 还 是 类 型 名 ， 不 仅仅 是 局 部 名 
称 ) 都 有 一 个 作用 范围 ， 即 该 名 称 存在 的 名 称 空间 。 在 其 作用 范围 之 外 ， 该 名 称 不 存在 ， 任 
何 对 它 的 引用 将 导致 一 个 错误 。 在 一 个 水 数 ( 艺 数 体 ) 内 部 赋值 定义 的 名 称 被 称 为 具有 局 
部 作用 范围 (相对 于 因数 调用 为 局 部 )， 这 意味 着 其 名 称 空 间 就 是 与 图 数 调 用 关联 的 名 称 
空间 。 

在 解释 需 命 令 行 或 在 模块 中 图 数 之 外 赋值 定义 的 名 称 则 被 称 为 具有 全 局 作用 范围 。 
其 作用 范围 是 与 命令 行 或 整个 模块 关联 的 名 称 空间 。 全 局 作用 范围 的 变量 被 称 为 全 局 
变量 。 


7.2.1 全 局 变量 


当 在 解释 器 命令 行 中 执行 一 条 Python 语句 时 ， 该 语句 在 与 命令 行 关联 的 名 称 空间 中 运 
行 。 在 此 上 下 文中 ， 名 称 空间 是 全 局 名 称 空间 ， 其 中 定义 的 变量 是 全 局 变量 。 例 如 : 


>>> a=0 
>>> a 
0 


a 是 全 局 变量 ， 其 作用 范围 是 全 局 的 。 

不 管 是 在 集成 开发 环境 之 内 还 是 之 外 执行 一 个 模块 时 ， 总 有 一 个 与 执行 模块 关联 的 名 称 
空间 。 在 执行 该 模块 的 过 程 中 ,该 名 称 空间 是 全 局 名 称 空间 。 任 何在 消 数 之 外 的 模块 中 定义 
的 变量 都 是 全 局 变量 。 例 如 ， 如 下 只 有 一 行 代 码 的 模块 scope .py 中 : 


模块 : scope.py 


' ## 一 个 非常 小 的 模块 
2 a=0 


a 是 全 局 变量 。 
7.2.2 局 部 作用 范围 的 变量 

我 们 使 用 一 系列 示例 来 说 明 全 局 范围 和 局 部 范围 之 间 的 区 别 。 我 们 的 第 一 个 例子 是 下 面 
这 个 奇怪 的 模块 。 


模块 : scope1.py 


' def f(b): # 下 具有 全 局 作用 范围 ，b 具有 局 部 作用 范围 
a= 6 # 这 个 a 是 函数 调用 ff( ) 的 局 部 变量 
return a*b # 这 个 a 是 局 部 变量 a 


; a=0 # 这 个 a 是 全 局 变量 


6 print('f(3) = {}'.format(f(3))) 
; print('a is {}'.format(a)) # 全 局 变量 a 依旧 是 0 


当 我 们 运行 该 模块 时 ， 首 先 执行 函数 定义 ， 然 后 依次 执行 模块 的 最 后 三 行 代码 。 名 称 
和 a 具有 全 局 作用 范围 。 当 在 第 六 行 调用 函数 E(3) 时 ， 局 部 变量 b 和 a 先后 在 也 数 调用 
f(3) 的 名 称 空间 中 被 定义 。 局 部 变量 a 与 全 局 变量 a 无 关 ， 如 图 7-6 所 示 。 
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图 7-6 局 部 变量 。 在 第 五 行 ， 整 数 0 被 赋值 给 全 局 变量 a。 在 第 六 行 执行 男 数 调用 f(3) 时 ， 
定义 了 一 个 相对 于 函数 调用 的 局 部 变量 a， 并 且 被 赋值 为 3 


当 模 块 执行 时 输出 如 下 结果 : 

£f(3) = 

a is 0 

注意 ， 执 行 £( 3) 过 程 中 ， 当 对 乘积 a*b 计算 结果 时 ,使 用 的 是 局 部 变量 名 称 a。 
7.2.3 全 局 作用 学 围 的 变量 

在 这 个 例子 中 ， 我 们 从 模块 scopel 中 删除 第 二 行 代 码 ， 得 到 模块 scope2 : 


模块 : scope2.py 


def f(bB)s 
return a*b # 这 个 a 是 全 局 变量 a 
+4 a=0 # 这 个 a 具有 全 局 作用 范围 


;Brint('4(3) = {}', Format(f (3))) 
print('a is {}'.format(a)) # 全 局 变量 a 依旧 是 0 


当 我 们 运行 模块 scope2 时 ,将 调用 函数 £(3)。 图 7-7 显示 了 函数 调用 f£(3) 执行 时 
所 涉及 的 变量 及 其 定义 的 名 称 空间 。 


困 数 工 () 





图 7-7 全 局 变量 。 在 执行 第 5 行 的 函数 调用 £(3) 过 程 中 ,计算 乘积 a*b 时 ， 变 量 a 被 求 值 。 
因为 在 函数 调用 名 称 空间 中 不 存在 名 称 a， 所 以 使 用 在 全 局 名 称 空间 中 定义 的 名 称 a 


在 执行 E(3) 的 过 程 中 ， 当 计算 乘积 axb 的 运算 结果 时 ， 在 函数 调用 fE(3) 相关 联 的 
名 称 空间 中 不 存在 局 部 变量 a。 变 量 a 使 用 的 是 全 局 变量 a， 甚 值 为 0。 运行 该 程序 时 ， 结 
条 如 下 : 


(3 =: 
a 1% 0 


Python 解释 带 如 何 确定 一 个 名 称 是 局 部 名 称 还 是 全 局 名 称 ? 
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无 论 什么 时 候 ， 当 Python 解释 器 需要 确定 一 个 名 称 (变量 、 图 数 ， 等 等 ) 的 求 值 结 采 
时 ， 将 按 下 列 顺序 搜索 名 称 定义 : 

1. 首先 在 包括 该 名 称 的 函数 调用 名 称 空间 

2. 然后 在 全 局 (模块 ) 名 称 空间 

3. 最 后 在 builtins 模块 的 名 称 空间 

在 我 们 的 第 一 个 例子 模块 scopel 中 ， 乘积 axb 中 的 名 称 a 解析 为 局 部 名 称 ; 在 第 二 个 例 
子 模块 scope2 中 ， 因 为 在 函数 调用 的 局 部 名 称 空间 中 没有 名 称 a， 所 以 a 解析 为 全 局 名 称 a。 

内 置 名 称 (例如 sum()、len()、print()， 等 等 ) 是 builtins 模块 中 预定 义 的 名 
尔 ，Python 启动 时 自动 导入 该 模块 (我 们 将 在 7.4 节 中 详细 讨论 内 置 模块 )。 网 7-8- 显 示 了 模 
块 scope2 中 四 数 调用 E(3) 执行 时 存在 的 不 同名 称 空 间 。 


print 
wi 
ed 
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图 7-8 查找 名 称 定义 。 运 行 模块 scope2 时 ， 在 执行 (3) 的 过 程 中 ， 存 在 三 个 名 称 空间 。 每 
当 Python 解释 器 需要 解析 一 个 名 称 时 ， 它 开始 在 局 部 名 称 空间 中 查找 。 如 采 没 有 查 到 ， 
则 接着 在 全 局 名 称 空间 中 查找 。 如 果 还 没有 查 到 ， 在 移动 到 builtins 名 称 空间 中 查找 


图 7-8 描述 了 在 执行 £(3) 时 ， 当 执行 函数 £( ) 的 第 二 行 的 语句 print (a*b) 过 程 中 
如 何 解 析 名 称 。print (a*b) 的 执行 包含 三 个 名 称 查 找 ， 所 有 的 查找 都 是 从 吕 数 调用 £(3) 
的 局 部 名 称 空间 中 开始 : 

1.Python 解释 器 首先 查找 名 称 a。 首 先 在 师 数 f(3) 的 局 部 名 称 空间 中 查找 。 因 为 不 存 
在 ， 所 以 继续 在 全 局 名 称 空间 中 查找 ， 结 果 发 现 名 称 a。 

2. 名 称 b 的 查找 开始 并 结束 于 局 部 名 称 空间 。 

3.〈 困 数 ) 名 称 print 的 查找 是 从 局 部 名 称 空间 中 开始 ， 接 大 在 全 局 名 称 空间 中 查找 ， 
最 后 在 模块 puiltins 名 称 空间 中 成 功 查 找到 。 


7.2.4 在 函数 中 改变 全 局 变量 

在 最 后 一 个 例子 中 ,我们 考虑 如 下 情况 : 假设 在 模块 scopel 中 的 果 数 人 () 中 ,语句 
a=0 的 目的 是 修改 全 局 变量 。 正 如 前 面 所 述 ， 在 模块 scopel 中 ， 盟 数 人 () 中 的 语句 其 实 
会 创建 一 个 新 的 同名 局 部 变量 。 如 果 我 们 的 目的 是 让 函数 修改 一 个 全 局 变量 ， 则 必须 使 用 保 
留 关 键 字 global 来 指明 一 个 名 称 是 全 局 名 称 。 我 们 使 用 下 面 模块 来 解释 关键 字 global: 


有 有 徐 人 多 阿 ,| 


模块 : scope3.py | 


def f(b): 
global a # 函数 下 () 中 所 有 对 a 的 引用 都 是 指向 全 局 变量 a 
a=6 # 修改 全 局 变量 a 
return a*b # 这 个 a 是 全 局 变量 

a=0 # 这 个 a 具有 全 局 作用 范围 

print('f(3) = {}' .format(f(3))) 

print('a ia {}'.Format(a)) # 全 局 变量 a 被 修改 为 6 


在 第 三 行 中 ， 赋 值 语句 a=6 把 全 局 变量 a 修改 为 6， 因 为 语句 global a 指定 名 称 a 
是 全 局 变量 而 不 是 局 部 变量 。 上 述 概 念 描述 如 图 7-9 所 示 。 


a 


b 
醒 
本 2 人 


图 7-9 关键 字 global。 在 f£(3) 的 执行 过 程 中 ,执行 了 赋值 语句 a=6。 因 为 名 称 a 被 定义 
为 指 问 全 局 名 称 a， 因 此 全 局 变量 a 被 赋值 。 在 了 少数 调用 的 局 部 名 称 空 间 中 没有 创建 


名 称 a 
当 运 行 该 模块 时 ， 修 改 后 的 全 局 变量 a 被 用 于 计算 £ (3 ): 
> 
f(3) = 
a is 6 





请 指出 如 下 模块 中 的 每 个 名 称 的 作用 范围 ， 是 全 局 名 称 还 是 f(xX) 或 g(x) 
的 局 部 名 称 。 


模块 : fandg.py 
def f(y): 
X= 2 
return g(x) 


def gl(y): 
global x 
区 二 加 
return x*y 


三 0 
res = f(x) 
print('s = {F, FE(0) = ("Bormat (tx, Yegs)) 


7.3” 异 弟 探 制 流 


虽然 本 革 讨 论 的 重点 是 名 称 空间 ， 但 我 们 还 小 及 了 为 一 个 基本 主题 ,操作 系统 和 名 称 空 
间 如 何 支 持 程 序 的 “正常 ”执行 控制 流 ， 特 别 是 函数 调用 。 在 本 节 中 ， 我们 考虑 当 “ 正 常 ” 
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执行 控制 流 被 异常 中 汤 时 会 发 生 什 么 情况 ， 以 及 控制 异常 控制 流 的 方法 。 本 市 还 继续 我 们 在 
4.4 方 中 开 始 的 有 关 异 第 的 讨论 。 


7.3.1 异常 和 异 音 控制 流 


错误 对 象 被 称 为 异常 ， 因 为 当 创 建 错误 对 象 时 ， 程 序 的 正常 执行 流 〈 例 如 ， 程 序 流程 图 
描述 的 流程 ) 被 中 断 ， 执 行 切换 到 所 谓 的 异常 控制 流 (流程 图 通常 不 会 描述 ， 因 为 它 不 是 正 
常 程 序 执行 过 程 的 一 部 分 )。 默 认 的 异常 控制 流 是 终止 程序 ， 并 输出 包含 在 异 帝 对象 中 的 错 
误 信 息 。 

我 们 使 用 7.1 节 中 定义 的 函数 £( )、g() 和 h() 来 说 明 。 在 图 7-2 中 ， 我 们 描述 了 函数 
调用 f(4) 的 正常 执行 流 。 在 图 7-10 中 ,我们 描述 了 从 命令 行 中 执行 函数 调用 f£(2) 时 发 
生 的 情况 。 


print ("Start ¥") 
g(n-1) 
n ] ws 
print('Start g') 
h(n-1) 







图 7-10 £(2) 的 执行 过 程 。 在 命令 行 中 ， 哺 数 调 用 -a 的 正常 执行 控制 流 显 示 为 实 线 租 头 : 
f(2) 调用 g(1)， 然 后 g(1) 调用 h(0)。 当 尝试 对 表达 式 1/n=1/0 求 值 时 ， 将 抛 
出 一 个 po 正常 执行 控制 流 被 终止 : 果 数 调用 hl(0) 不 会 
继续 运行 完成 ，g(1) 和 ff(2) 也 不 会 继续 运行 完成 。 异 稼 控制 流 显示 为 虚线 箭头 。 
不 会 执行 的 语句 显示 为 灰色 。 由 于 调用 £(2) 被 终止 ， 因 此 在 命令 行 输出 错误 信息 


程序 执行 一 直 正 常 ， 直 到 少数 调用 h(0)。 在 h(0) 的 执行 过 程 中 ,，n 的 值 为 0。 因 此 ， 
当 对 表达 式 1/n 求 值 时 ， 产 生 了 错误 状态 。 解 释 器 抛 出 ZeroDivisionError 寞 肖 ， 并 
创建 一 个 包含 该 错误 信息 的 ZeroDivisionError 异常 对 象 。 

当 抛 出 异常 时 ， 上 默认 的 行为 是 终止 发 生 错 误 的 函数 调用 。 因 为 错误 发 生 在 执行 h(0) 
时 ， 因 此 h(0) 的 执行 被 中 断 。 然 而 ， 错 误 同 样 发 生 在 函数 调用 g(1) 和 E(2) 的 执行 过 程 
中 ， 因 此 这 两 个 函数 也 同样 被 中 断 。 因 此 ， 图 7-10 中 显示 为 灰色 的 语句 永远 不 会 被 执行 。 

当 执 行 返回 到 命令 行 时 ， 在 命令 中 输出 异常 对 象 中 包含 的 信息 : 

Traceback (most recent call last): 

File "<pyshell#116>", line 1, in <module> 
(2) 


File "/UVUsers/me/chT .py", line 13, in i 
gl(n-1) 
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File "/Users/me/ch7.py”", line 8, in g 
h(n-1) 

File "/Users/me/ch7 .py", line 3, in h 
print (1/n) 


ZeroDivisionError: division by Zero 


除了 错误 类 型 和 友好 的 错误 消息 之 外 ， 输 出 还 包括 一 个 回溯 (traceback)， 它 包括 因 错 误 
而 中 断 的 所 有 上 曙 数 调用 。 


7.3.2 ”捕获 和 处 理 异常 


一 些 程序 当 抛 出 异常 时 不 应 该 终止 运行 : 服务 胡 程 序 、 命 令 行 程序 、 以 及 几乎 所 有 处 理 
请 求 的 程序 。 由 于 这 些 程序 接收 来 日 程序 外 的 请 求 (与 用 户 或 文件 交互 )， 很 难 确保 程序 不 
会 因为 输入 错误 而 进入 错误 状态 。 即 使 内 部 错误 发 生 ， 这 些 程序 也 需要 继续 提供 服务 。 这 意 
味 痢 ,必须 改 变 当 发 生 错 误 时 输出 错误 消 县 并 终止 程序 的 默认 行为 。 

我 们 可 以 通过 指定 发 生 异 第 时 的 蕉 代行 为 来 更 改 上 默 认 的 异常 控制 流 。 我 们 使 用 try/ 
except 语句 对 实现 该 功能 。 下 面 这 个 小 应 用 程序 演示 了 如 何 使 用 它们 : 


模块 : age1.py 


strAge = input('Enter your age: ') 
intAge = int(strAge) 
print('You are {} years old.'.format(intAge)) 


应 用 程序 请 求 用 户 交 互 式 输入 其 年 龄 。 用 户 输 入 的 值 是 一 个 字符 串 。 输 出 前 被 转换 为 一 
个 整数 值 。 请 读者 尝试 运行 ! 

只 要 用 户 输入 的 值 能 够 转换 为 一 个 整数 ,这 个 程序 就 能 正常 运行 。 但 是 ， 如 果 用 户 输入 
“fifteen”,， 结 果 会 如 何 呢 ? 


>>> 
Enter your age: fifteen 
Traceback (most recent call last): 
File "/Users/me/agel.py", line 2, in <module> 
intAge = int(strAge) 
ValueError: invalid literal for int() with base 10: 'fifteen'! 


因为 字符 串 ' fifteen' 无 法 转换 为 一 个 整数 ， 所 以 引发 了 异常 ValueError。 
执行 语句 age=int (strAge) 时 除了 “ 朋 演 ”处 理 之 外 ， 更 好 的 处 理 方式 是 提示 用 户 
输入 十 进 制 数字 的 年 龄 。 我 们 可 以 通过 下 面 的 try 和 except 语句 对 来 实现 此 功能 : 


模块 : age2.py 


try: 

# 七 TY 语句 块 --- 先 执 行 ， 

# 如 果 引 发 了 异常 ， 则 try 语句 块 的 执行 被 中 断 

strAge = input('Enter your age: ') 

intAge = int(strAge) 

print('Yonu are {} years old.'.format (intAge)) 
except: 

# exXCept 语句 块 --- 

# 仅 当 执 行 上 zy 语句 块 引 发 了 异常 时 才 执行 


print('Enter your age using digits 0-9!') 
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try 语句 和 except 语句 联手 工作 。 各 日 下 面具 有 其 缩 进 代码 。try 语句 下 面 的 代码 块 
(从 第 二 行 到 第 六 行 ) 首先 被 执行 。 如 果 没 有 发 生 错 误 ， 则 except 下 面 的 代码 块 被 忽略 : 


>>> 
Enter your age: 22 
You are 22 years old. 


然而 ， 如 果 在 执行 try 语句 块 的 过 程 中 引发 了 异常 (例如 ，strage 无 法 转换 到 一 个 整 
数 )， 则 Python 解释 需 将 跳 过 try 语句 块 中 的 后 续 语 句 ， 并 执行 except 语句 块 中 的 语句 
( 即 从 第 八 行 到 第 十 行 ): 

>>> 

Enter your age: fifteen 

Enter your age using digits 0-9! 

注意 : try 语句 块 的 第 一 条 语句 被 执行 ， 但 不 是 最 后 一 条 被 执行 的 语句 。 

try/except 语句 对 的 语法 格式 如 下 : 

Gy: 
< 缩 进 代码 块 1> 

except: 

< 缩 进 代 码 块 2> 

< 非 缩 进 语句 > 

首先 尝试 执行 < 缩 进 代码 块 1>。 如 采 执 行 顺利 没有 引发 异 稼 ， 则 忽略 < 缩 进 代 码 块 
2>， 继 续 执行 < 非 缩 进 语句 >。 然而 ， 如 果 在 执行 < 缩 进 代码 块 1> 过 程 中 引发 了 一 个 异常 ， 
则 < 缩 进 代码 块 1> 中 剩余 的 语句 不 会 被 执行 ， 而 是 执行 < 缩 进 代 码 块 >>。 如 果 < 缩 进 代 码 
块 2> 运行 完成 并 且 没 有 引发 新 的 异 帝 ， 则 继续 执行 < 非 缩 进 霹 名 >。 

代码 块 < 缩 进 代码 块 2> 被 称 为 弄 常 处 理 程序， 因为 它 处 理 引 发 的 异常 。 我 们 也 称 一 个 
except 语句 捕获 一 个 异常 。 


7.3.3 默认 异 弟 处 理 程 序 


如 果 一 个 抛 出 的 异常 没有 被 一 个 except 语句 捕获 (因此 没有 被 用 户 自 定义 异常 处 理 程 
序 处 理 )， 正 在 执行 的 程序 将 被 终止 ， 并 输出 回溯 和 错误 信息 。 运 行 模块 agel .py 并 输入 一 
个 字符 串 年 龄 时 可 以 观测 到 该 行为 : 

>y>> 

Enter your age: fifteen 

Traceback (most recent call last): 

File '"/Users/me/agel.py", line 2, in <module> 
intAge = int(strAge) 

ValueError invalid literal for int() with base 10; 'fifteen ' 

这 种 默认 行为 实际 上 是 Python 的 默认 异常 处 理 程序 的 工作 。 换 言 之 ， 每 个 抛 出 的 异常 
都 会 被 捕获 和 处 理 ， 如 果 不 被 一 个 用 户 自 定义 处 理 程序 捕获 处 理 ， 则 会 被 默认 异常 处 理 程序 
捕获 处 理 。 


7.3.4 ”捕获 给 定 类 型 的 异常 
在 模块 age2 .py 中 ，except 语句 可 以 捕获 任何 类 型 的 异常 。except 语句 还 可 以 指 
定 仅 仅 捕 获 某 种 类 型 的 异常 ， 例 如 ，ValueError 异常 : 
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模块 : age3.py 
LrYy: 
# 七 ry 语句 块 
strAge 三 input'(， Enter your age : 1 )》 
intAge = 


print('You are {} years old.' .format(intAge)) 
except RE 

# eXCept 语句 块 ~-- 仅 当 ValueError 才 执 行 

# 异常 在 try 语句 块 中 抛 出 


print('Enter your age using digits 0-9!1') 


op 人 


如 果 在 执行 try 语句 块 中 引发 了 一 个 异常 ， 则 仅 当 异常 对 象 与 except 语句 中 指定 的 
寞 常 类 型 匹配 时 (示例 中 为 ValueError)， 才 会 执行 异常 处 理 程序 。 如 果 一 个 抛 出 的 异常 
与 except 语句 中 指定 的 异常 类 型 不 匹配 ， 则 except 语句 不 会 捕获 该 异常 。 作 为 替代 ， 
将 被 默认 异常 处 理 程 序 捕获 并 处 理 。 


7.3.5 ”多 重 异 常 处 理 程 序 


try 语句 后 可 以 紧 跟 多 个 except 语句 ， 每 个 except 语句 有 自己 的 异常 处 理 程序 。 
我 们 使 用 如 下 的 函数 readAge( ) 为 例 来 说 明 。readAge( ) 在 一 个 try 语句 块 中 尝试 打开 
一 个 文件 ， 读 取 第 一 行内 容 ， 并 将 其 转换 为 一 个 整数 。 


模块 : ch7.py 


def ne 
把 文件 filename 的 第 一 行内 容 
转换 为 一 个 整数 并 输出 ，'， 
try: 
infile = open(filename) 
strAge = infile.readline() 
age = int(strAge) 
print('age is', age) 
except IOError : 
# 仅 当 抛 出 IOError 异常 时 才 执 行 
print('Input/Voutput error.') 
except ValueErTror : 
# 仅 当 抛 出 ValueError 异常 时 才 执 行 
print('Value cannot be converted to integer.') 
except: 
# 当 抛 出 IOError 和 ValueError 之 外 的 
# 异常 时 ， 执 行 
beint('Uther eror.!) 


执行 函数 readAge 的 try 代码 块 时 ， 可 能 会 引发 若干 不 同类 型 的 异常 。 文 件 可 能 不 
存在 

>>> readAge('agg.txt') 

Input/Output error. 

在 这 种 情况 下 ， 执 行 try 语句 块 的 第 一 条 语句 时 将 抛 出 IOError。 语句 块 中 剩余 的 语 
句 将 被 跳 过 ， 执 行 ITOError 异常 处 理 程序 。 

万 一 种 错误 是 文件 age .txt 的 第 一 行 不 包含 可 以 转换 为 一 个 整数 值 的 内 容 : 
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>3> readAge('age.txt') 
Value cannot be converted to integer 


文件 age .txt 的 第 一 行 的 内 容 是 'fifteen\n' ， 因 此 尝试 把 它 转 换 为 一 个 整数 时 ， 
会 引发 ValueErzror 异常 。 关 联 的 异常 处 理 程序 输出 用 户 友 好 的 提示 信息 ， 不 中 断 程序 。 
最 后 一 个 except 语句 将 捕获 前 两 个 except 语句 没有 捕获 的 任何 其 他 异常 。 


知识 拓展 : 阿 丽 亚 娜 5 火箭 首 飞 

1996 年 6 月 4 日 ， 由 欧洲 航天 局 研发 多 年 的 阿 丽 亚 娜 $ 型 火箭 进行 了 首 飞 测试 。 发 
射 后 几 秒 钟 ， 火 箭 爆 炸 了 。 

事故 发 生 的 根源 是 把 一 个 浮 点 数 转 换 到 整数 时 引发 了 溢出 异常 。 事故 的 原因 并 不 是 转 
换 失 败 (事实 证 明 ， 这 并 不 重要 )。 真 正 的 原因 是 没有 进行 异常 处 理 。 正 因为 如 此 ， 火 入 
控制 软件 月 溃 了 ， 并 关闭 了 火箭 电脑 。 没 有 了 导航 系统 ， 火 箭 开 始 无 法 控制 地 转动 ， 机 载 
控制 器 使 火箭 自 毁 。 

这 可 能 是 历史 上 最 昂贵 的 电脑 错误 之 一 。 


有 为 open() 函数 创建 一 个 “包装 器 ”函数 safe-open()。 调 用 open() 
来 打开 一 个 在 当前 工作 目录 不 存在 的 文件 时 ， 会 抛 出 一 个 异 第 : 
> open('ch7 .px', :下 
Traceback (most recent call last): 
File "<pyshell#19>", line 1, in <module> 


openl'ceh? px’ , 'r') 
IOError: [Errno 2] No such file or directory: 7 cn87 ,px 


如 果 文件 存在 ， 则 返回 一 个 指向 打开 文件 对 象 的 引用 : 

3 Opa eh, py, EY 

<_io.TextIlOWrapper Dame= ' ch7 .py' encoding='US-ASCII'> 

当 使 用 safe-open() 打开 一 个 文件 时 ， 如 果 没 有 引发 异常 ， 则 返回 指向 打开 文件 对 
象 的 引用 ， 这 和 open() 函数 一 致 。 如 果 尝 试 打开 文件 时 引发 了 异常 ， 则 safe-open() 
返回 None。 


>>> safe-open('ch7.py', 'r') 

“<“_10.TIextIOWrapper name='ch7 .py' encoding='US-ASCII'> 
> safe-open('eh? .p's 二 1 

>>> 


7.3.6 控制 异种 流 


本 节 开 始 以 一 个 例子 演示 了 异常 如 何 中 断 程序 的 正常 流程 。 现 在 我 们 讨论 如 何 使 用 适 
当 放 置 的 异常 处 理 程序 来 控制 异常 流 。 我 们 再 次 使 用 在 模块 stack .py 中 定义 的 函数 £( )、 
g() 和 h() 作为 示例 。 


模块 : stack.py 


def h(n): 
Drint (Start hy 
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print (1/n) 
print (n) 


s def g(n): 
print( Stat g') 
h(n-1) 
print (n) 


def f(n): 
print('Start £f') 
gl(n-1) 
print (n) 


在 图 7-10 中 ， 我 们 说 明了 对 f£f(2) 求 值 如 何 引 发 一 个 异常 。 当 执行 f(0) 时 ， 尝 试 


对 1/0 求 值 会 引发 ZeroDivisionError 异常 。 因 为 在 函数 调用 h(0)、g(1) 和 f(2) 
中 都 没有 捕获 该 异常 对 象 ， 这 些 也 数 都 会 被 中 汤 ， 默 认 异 常 处 理 程 序 会 处 理 该 异常 ， 如 


图 7-10 所 示 。 


假如 我 们 希望 捕获 抛 出 的 异常 ， 处 理 并 输出 ' Caught!'， 


然后 继续 正和 并 的 程序 流 。 如 


何 编写 try 代码 块 和 捕获 异常 ， 有 几 种 不 同 的 处 理 方 法 供 选 择 。 其 中 一 种 方法 是 把 最 外 层 
的 盟 数 调用 f(2) 放置 在 一 个 try 代码 块 中 (如 图 7-11 所 示 ): 


>>2> try: 
人 人 2 
except: 
print('Caught!') 


运行 命令 行 
f (2) 


n= 2 


prinbt "Sys 
gl(n-1) 


运行 &(1) 






bE: 
print('S...') | 
h(n-1) 


运行 h (0) 


n=0 


print('Start /h') 
aa 
eXCept : 和 | | lprint(n) 


print('Caught!') | print (n) 
| | | | 


| 
| Iprint(n) 
| | 


使 用 一 个 异常 处 理 程序 执行 £(2)。 在 一 个 try 代码 块 中 运行 £(2)。 程 序 正常 运行 ， 
直到 执行 hn(0) 时 抛 出 了 一 个 异常 。 正 常 执 行 流程 被 中 断 : 函数 h (0) 执行 没有 完成 ， 
g(1) 和 f(2) 也 没有 完成 。 虚 线 显示 了 异常 执行 流程 。 没 有 被 执行 的 语句 显示 为 灰 
色 。 对 应 于 try 语句 块 的 except 语句 捕获 异常 ， 匹 配 的 处 理 程 序 处 理 该 异常 


图 7-11 的 执行 流程 与 图 7-10 中 摘 述 的 平行 一 致 ， 直 到 从 命令 行 发 出 图 数 调 用 于 (2) 


图 7-11 


被 一 个 引发 的 寞 和 常 中 断 。 因 为 荫 数 调用 位 于 一 个 try 语句 块 ， 因 此 该 异常 被 对 应 的 


188 邹 7 莫 


except 语句 捕 获 并 由 其 异 稍 处 理 程 序 处 理 。 输 出 结果 包含 异 背 处 理 程序 输出 的 字符 
器 “Caughtl! 

Start f 

Start g 


Start h 
Caught ! 


与 这 段 执 行 流程 相 比 ， 图 7-10 使 用 默认 异种 处 理 程 序 处 理 异 常 。 

在 上 一 个 例子 中 ,我们 选择 在 调用 消 数 £(2) 时 实现 异 津 处 理 程序 。 这 体现 了 孙 数 ££() 
开发 人 员 的 设计 决策 ， 也 就 是 函数 用 户 才 比较 关注 异常 处 理 。 \ 

在 下 一 个 示例 中 ， 图 数 h() 开发 人 员 的 设计 决策 是 ， 果 数 h() 才 应 该 处 理 其 执行 
过 程 中 发 生 的 异 笛 。 在 这 个 例子 中 ， 困 数 h() 内 原本 的 代码 修改 为 位 于 一 个 try 语句 
块 中 : 


模块 : stack2.py 


def h(n): 
try: 
print("Start kh") 
print (1/n) 
print (n) 
except: 
print('Caught!') 


(因数 E() 和 gl() 与 stack.py 中 的 图 数 定 义 一 模 一 样 。) 当 运 行 f(2) 时 ， 结 果 
如 下 : 

yy 

Start 于 

Start 区 

Start hh 

Caught! 


2 


图 7-12 描述 了 其 执行 流程 。 执 行 流程 与 图 7-11 中 平行 一 致 ， 直 到 对 1/0 求 值 时 引发 了 
异常 。 由 于 求 值 处 于 一 个 try 语句 块 ， 因 此 对 应 的 except 语句 捕获 了 该 异常 。 关 联 的 异 
常 处 理 程序 输出 'caught!'。 当 异常 处 理 程 序 执行 完毕 ， 继续 执行 正常 的 执行 控制 流程 ， 
师 数 h(0) 、g(1) 和 £(2) 都 执行 完毕 。 


假设 对 stack .py 做 如 下 修改 ， 则 运行 上 (2) 时 ， 模 块 stack.py 中 的 
哪些 语句 不 会 被 执行 ? 

(a) 仅 在 h() 中 添加 try 语句 封装 语句 print(1/n)， 

(b) 在 g() 中 添加 try 语句 封装 三 行 语句 。 

(c) 仅 在 g() 中 添加 try 语句 封装 语句 h(n-l1)。 

上 述 各 种 情况 下 ,与 try 语句 块 关联 的 异常 处 理 程序 仅仅 输出 'Caught!'。 
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运行 命令 行 : 运行 f(2) 





prinb('Start 王 (于 | 
g(n-1) 






| 运行 h (0) 
iprint('Start g')| 


| | n(n-1) 






try: 


print('Start/h') 
‘print(1/n | 
print (n) 1 


| 
] | 
| ‘except: < 











print( cangntt') 






print(n) 






print (n) 


图 7-12 执行 £(2)， 在 h() 中 包含 一 个 异常 处 理 程序 。 正 常 执行 流程 显示 为 黑色 箭头 。 当 尝 
试 对 1/n = 1/0 求 值 时 ,引发 了 ZeroDivisionError 异常 ， 正 常 执行 流程 中 断 。 
虚线 显示 了 异常 执行 流程 ， 没 有 被 执行 的 语句 显示 为 灰色 。 由 于 异常 发 生 在 try 语 
句 块 中 ， 因 此 对 应 的 except 语句 捕获 该 异 弟 ， 关 联 的 异常 处 理 程序 处 理 该 异常 。 然 
后 恢复 执行 正常 执行 流程 ， 也 数 h(0)、g(1) 和 f£(2) 都 执行 完毕 


7.4 模块 作为 名 称 空间 
到 目前 为 止 ， 我 们 使 用 术语 模块 来 描述 包含 Python 代码 的 文件 。 当 执行 (导入 ) 模块 
， 模 块 也 是 名 称 空间 。 这 个 名 称 空间 有 一 个 名 称 ， 它 是 模块 的 名 称 。 在 这 个 名 称 空间 中 ， 


Es ee on te 
模块 的 属性 


7.4.1 模块 属性 
正如 前 文 所 述 ， 为 了 访问 标准 库 模块 math 中 的 所 有 哺 数 ， 我们 导入 模块 
>>> import math 


一 旦 一 个 模块 被 导入 ， 则 可 以 使 用 Python 内 置 也 数 dir( ) 查看 模块 的 所 有 属性 : 


> ema 
a doc 了 0 


i i ES < Ps ep 
acosh ， asin » dB 。 "atan 
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"SOPyYSIRD 5s OS i "COS dotees Ss Gs "SxD!',. "fabe"', 
Eactorial ys "Floor s "nod's “treyp' s "Faunm's "jypot's "tsint’ 
“Lanan ss Ja "og» "Tol0", "logip,. “madf sy “pa 
adans us adnu’'s "and" "mart's "has “banbh', Srunc "i 


(根据 正在 使 用 的 Python 版 本 不 同 ， 列 表 内 容 也 许 会 稍 有 差异 。) 读者 可 以 发 现 许 多 已 经 
使 用 过 的 数学 清 数 和 常量 。 

使 用 熟悉 的 符号 访问 模块 中 的 名 称 ， 可 以 查看 这 些 名 称 引 用 的 对 象 : 

>>> math.sgqgrt 

<built-in function sgrt> 


>>> math .pi 
3.141592653589793 


现在 可 以 理解 这 个 符号 的 真正 含义 : math 是 一 个 名 称 空间 ， 而 表达 式 math .pi， 则 
解析 为 名 称 空间 math 中 的 名 称 pi。 


知识 拓展 :“ 其 他 ”导入 的 属性 
dir() 函数 的 输出 结果 显示 了 在 math 名 称 空间 中 存在 一 些 很 显然 非 数 学 函数 或 党 
量 的 属性 :doc 、 file 、 name 和 _ package  。 He 
都 包含 这 些 名 称 。 这 些 名 称 在 导入 时 由 Python 解释 器 定义 ， 并 由 Python 解释 器 保存 ， 
于 记 账 目的 。 
模块 的 名 称 、 包 含 模块 文件 的 绝对 路 径 名 、 模 块 的 文档 字符 串 分 别 存储 在 变量 _ 
name 、 file 和 aoe 中。 


7.4.2 导入 模块 时 发 生 了 什么 


当 Python 解释 需 执 行 jmport 语句 时 ， 它 执行 如 下 操作 : 

1. 查找 与 模块 相对 应 的 文件 。 

2. 运行 模块 中 的 代码 ， 创 建 在 模块 中 定义 的 对 象 。 

3. 创建 包含 这 些 对 象 名 称 的 名 称 空间 。 

我 们 将 在 下 一 节 详 细 讨 论 第 一 步 。 第 二 步 包 括 执行 模块 中 的 代码 ， 这 意味 着 从 上 到 下 执 
行 导入 模块 中 的 所 有 Python 语句 。 所 有 的 赋值 语句 、 函 数 定义 、 类 定义 和 导入 语句 都 将 创 
建 对 象 (无 论 是 整数 或 者 字符 串 对 象 ， 还 是 函数 、 模 块 或 者 类 )， 并 生成 结果 对 象 的 属性 ( 即 
名 称 )。 这 些 名 称 将 存储 在 一 个 新 的 命名 空间 中 ， 命 名 空间 的 名 称 通常 是 模块 的 名 称 。 


7.4.3 ”模块 搜索 路 径 


现在 我 们 来 看 看 解释 需 是 如 何 找到 要 导入 的 模块 所 对 应 的 文件 的 。impozrt 语句 只 列 出 
名 称 〈 模 块 的 名 称 )， 没 有 任何 目录 信息 或 .py 后 级 。Python 使 用 Python 搜索 路 径 来 定位 模 
块 。 搜 索 路 径 只 是 一 个 目录 (文件 夹 ) 列表 ，Python 将 在 其 中 寻找 模块 。 标 准 库 模 块 sys 中 
定义 的 变量 名 称 path 指 问 此 列表 。 因 此 ， 通过 在 shell 中 执行 下 面 命令 ， 可 以 查看 (当前 ) 
搜索 路 径 是 什么 : 


>>> import sys 
>>> sys.path 
['/Users/me/Documents', 本 
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(我 们 忽略 包含 标准 库 模 块 的 长 目录 列表 。) 模块 搜索 路 径 总 是 包含 顶层 模块 的 目 
录 ， 我 们 将 在 下 一 节 讨 论 ， 也 包含 标准 库 模 块 的 目录 。 在 每 个 导 人 语句 中 ， Python 将 从 
左 到 右 在 该 列表 中 的 每 个 目录 中 搜索 请 求 的 模块 。 如 果 Python 找 不 到 模块 ， 则 引发 一 个 
ImportError 异常 。 

例如 ， 假 设 我 们 希望 导入 保存 在 主 目录 /Users/me (或 其 他 任何 保存 example.py 
的 目录 ) 中 的 模块 example .py: 


模块 : example.py 


一 个 示例 模块 ， 
def f(): 


， 函数 £， 
4 print('Executing f{)') 


print('Executing ZC} ) 
x = 0 # 全 局 变量 


叶 人 该 模块 之 前 ,我 们 运行 水 数 diz ( ) ， 检 查 在 命令 行 名 称 空间 中 定义 了 哪些 名 称 : 


>>> dir() 


Lballvins /sy ‘6 "1 Mume .ii "Dackate... 


当 不 带 参 数 调用 也 数 dir() 时 ， 结 果 返 回 当 前 名 称 空 间 中 的 名 称 ， 在 本 例 中 为 命令 
行 名 称 空间 。 结 果 似 乎 只 显示 了 定义 的 “ 记 账 ”名 称 。( 请 读者 阅读 下 一 个 有 关 名 称 
builtins _ 的 拓展 知识 ,) 

现在 ， 让 我 们 尝试 导入 模块 example.py: 


>>> import example 
Traceback (most recent call last): 
File "<pyshell#24>", line 1, in <module> 
import example 
ImportError: No module named example 


结果 并 不 成 功 ， 因 为 sys .path 列表 中 不 存在 目录 /Users/me。 因 此 让 我 们 把 它 添 加 
到 列表 中 : 


>>> import sys 
>>> sys.path.append('/Users/me') 


然后 重 试 : 


>>> import example 

>>> example.f 

<function f at Oxil5e7d68> 
>>> example.x 


0 

运行 成 功 。 让 我 们 再 次 运行 dir ( ) 检查 模块 example 是 否 成 功 导 入 : 
>>> dir() 
RE TR ‘__package__'", 'example ， 


'sys'] 
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知识 拓展 : builtins 
名 称 builtins 指向 builtins 模块 的 名 称 空间 ， 我们 在 图 7-8 中 引用 过 
builtins 模块 包含 了 所 有 的 内 置 类 型 和 函数 ， 通 篆 在 启动 Python 时 目 动 导 入 。 全 
用 Gir() 函数 列 出 模块 builtins 的 属性 可 以 证 明 这 一 点 : 
> dirl builtins..) 


['ArithmeticError', dssertionError',y cs Vargs', Eady 


信访， 使 思 ldrl builtine ha 而 不 太 ixt” biltins ®)a 





有 i 议 在 sys.path 中 列举 的 路 径 之 一 中 查找 random 模块 ， 打 开 该 模块 ， 查 
找 荡 数 randrange()、random() 和 sample() 的 实现 。 然 后 导入 该 模块 到 解释 器 命令 
行 ， 并 使 用 dir( ) 函数 查看 其 属性 


7.4.4 ”顶层 模块 


计算 机 程序 通常 被 拆 分 为 多 个 文件 ( 即 模块 )。 在 每 一 个 I 程序 中 ， 其 中 一 个 模块 
惩 特殊 的 : 它 包 含 “ 主 程序 "， 我 们 指 的 是 局 动 应 用 程序 的 代码 。 这 个 模块 称 为 顶层 模 块 。 
其 余 模块 本 质 上 是 “ 模块 ， 由 顶级 模块 导入 ， ei 
我 们 已 经 看 到 ， 当 一 个 模块 被 导入 时 ,Python 解释 器 在 模块 名 称 空间 中 创建 一 些 “ 记 账 ” 
王后。 直下 玉生 攻 _name _。Python 将 以 下 列 方式 设置 它 的 值 : 
。 如 果 模 块 是 作为 一 个 正在 运行 的 顶层 模块 ， 则 其 属性 ”name _ 被 设置 为 字符 串 _ 


”区 
。 如果 该 文件 被 男 一 个 模 抉 (不 管 项 层 模块 或 其 他 模块 ) 导入 ， 则 其 属性 _ _name _ 
被 设置 为 模块 的 名 字 


我 们 使 用 下 一 个 模块 来 说 明 ”name _ 如 何 被 赋值 : 


模块 : name.py 


print('My name is {}'.format(__name.__)) 


当 从 命令 行 中 运行 该 模块 (例如 ， 在 IDLE 中 按 【 F5 】)， 它 作为 主 程序 运行 ( 即 顶 层 模块 ): 
>>> 
My name is __main 


因此 ， 嘻 入 的 模块 的 ”name _ 属性 被 设置 为 ”main _ 


知识 拓展 : 顶层 模块 和 模块 搜索 路 径 
在 上 一 小 节 中 ,我 们 提 到 ， 包 含 顶 层 模 块 的 目录 包括 在 搜索 路 径 列表 中 。 让 我 们 检 
一 下 和 情况 是 否 确实 如 此 。 首 先 运行 前 述 模 块 name .py (假设 被 保存 在 目录 /Users/ 
me )。 然 后 检查 sys .path 的 值 : 


>>> import sys 
>>> sys.path 


[‘/Users/me', '/Users/me/Documents', ...] 


注意 ，/Users/me/ 包括 在 搜索 路 径 中 。 
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当 从 命令 行 中 运行 时 ， 模 块 name 同样 是 顶层 模块 : 


> python name.py 
My name is __main__ 


然而 ， 如 果 其 他 模块 导入 模块 name， 则 name 不 再 是 顶层 模块 。 在 如 下 import 语句 
中 ， 命 令 行 是 导入 模块 name .py 的 顶层 程序 : 


>>> import name 
My name is name 


下 面 是 另 一 个 示例 。 这 个 模块 仅仅 包含 ， 一 条 导 和 人 模块 name .py 的 语句 : 


模块 : import.py 


import name 


当 从 命令 行 运 行 模块 import .py， 它 作为 主 程序 运行 ， 并 导入 模块 name .py: 
>>> 
My name is name 


两 种 情况 下 ， 导 入 模块 的 ”name 属性 均 被 设置 为 模块 的 名 称 。 

在 模块 中 编写 仅 当 作为 项 层 模 块 运行 时 才 执 行 的 代码 时 ,模块 的 ” name 属性 才 发 
挥 作用 。 例 如 ， 如 果 模 块 是 一 个 包含 滑 数 定义 的 “ 库 ” 模 块 ， 而 我 们 希望 在 模块 中 添加 仅 当 
模块 作为 顶层 模块 才 运 行 的 调试 代码 的 情况 。 只 需要 把 所 有 的 调试 代码 作为 下 列 if 语句 的 
语句 块 即 可 : 


# 代码 块 
如 果 模 块 作为 顶层 模块 运行 ， 则 代码 块 将 被 执行 ; 否则 ， 不 会 被 执行 。 


0 攻 作 调 在 模块 example.py 中 添加 代码 ， 调 用 模块 中 定义 的 函数 并 输出 模块 中 
定义 的 变量 的 值 。 仅 当 模块 作为 顶层 代码 运行 时 才 执行 添加 的 代码 ， 例 如 从 命令 行 中 运行 : 

>>> 

Testing module example: 

Executing f() 


Executing g() 
0 


7.4.5 导入 模块 属性 的 不 同方 法 


现在 我 们 讨论 三 种 不 同 的 导入 模块 及 其 ` 属性 的 方法 .并 讨论 每 种 方法 的 优点 。 再 次 使 
用 example 模块 作为 运行 示例 : 


模块 : example.py 


一 个 示例 模块 ， 
def f£f():; 
print('Executing £f()') 


def g(): 
print('Executing gC) *) 
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， 过 二 站 二 术 局 变量 


访问 函数 £( )、g( ) 或 全 局 变量 x 的 一 种 方法 是 : 


>>> import example 


这 条 导 人 语句 将 查找 文件 example .py， 并 运行 其 中 的 代码 。 结 果 将 实例 化 两 个 函数 
对 象 和 一 个 整 型 对 象 ， 并 创建 一 个 名 为 example 的 名 称 空间 ， 这 个 名 称 空间 保存 创建 的 对 
象 的 名 称 。 为 了 访问 和 使 用 模块 属性 ， 必 须 指定 模块 名 称 空间 : 


>>> example.f() 
Executing f£() 


如 前 所 述 ， 直 接 调用 上 () 将 导致 一 个 错误 。 因 此 ，import 霹 句 并 不 会 把 名 称 于 置 于 
模块 main ”的 名 称 空间 (导入 example 的 模块 )。 它 仅仅 导入 模块 的 名 称 example， 
如 图 7-13 所 示 。 





example 


| 二 一 一 一 一 [下 


名 称 空 间 _main _ 


图 7-13 导入 一 个 模块 。 语 句 import _ example 在 调用 模块 名 称 空 间 中 创建 一 个 名 称 
example，example 指 回 与 导入 模块 example 关联 的 名 称 空间 


除了 导入 模块 名 称 ， 还 可 以 使 用 from 命令 导入 需要 的 属性 名 称 本 号 ; 


>>> from example import 工 


如 图 7-14 所 示 ，from 把 属性 f£ 的 名 称 拷贝 到 主 程序 (执行 导入 的 模块 )， 因 此 ， 可 以 
直接 引用 £， 而 不 用 指定 模块 名 称 。 


> 
Executing 工 () 






名 称 空间 __ 


图 7-14 导入 一 个 模块 属性 。 模 块 属性 可 以 导入 到 调用 方 模块 名 称 空 间 。 语 句 from 
example import f 在 调用 方 名 称 空间 创建 名 称 £， 指 疝 对 应 的 孔 数 对 象 


注意 ， 上 述 代码 仅仅 拷贝 属性 £， 没 有 拷贝 属性 g (如 图 7-14 所 示 )。 直 接 引 用 g 将 导 
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致 一 个 错误 : 
>>> gO() 
Traceback (most recent call last): 
File "<pyshell#7>", line 1, in <module> 


g() 


NameError: name 'g' is not defined 


最 后 ， 还 可 以 使 用 from 通过 通配符 * 导入 一 个 模块 中 的 所 有 属性 : 


>>> from example import * 
Sy PE 

Executing f() 

3 商 

0 


图 7-15 显示 example 的 所 有 属性 都 被 拷贝 到 名 称 空间 __main _ 中 。 





图 7-15 导入 模块 的 所 有 属性 。 语 句 from example import * 导入 模块 example 的 所 有 
属性 到 调用 者 模块 名 称 空 间 中 


哪 种 方法 最 好 呢 ? 这 是 一 个 很 难 回答 的 问题 。 这 三 种 方法 都 有 其 各 自 的 优点 。 仅 仅 导入 
模块 名 有 利于 将 模块 中 的 名 称 与 主 模块 分 开 。 这 保证 了 主 模块 中 的 名 称 与 导入 模块 中 的 相同 
名 称 之 间 不 会 发 生 冲 突 。 

从 模块 中 导入 单个 属性 的 好 处 是 ， 在 引用 属性 时 不 需要 使 用 名 称 空间 作为 前 级 。 这 有 
助 于 精简 代码 ， 因 此 可 读 性 更 强 。 通 过 import * 导入 模块 所 有 的 属性 也 具有 相同 的 优点 ， 
且 导 入 过 程 更 加 简洁 。 然 而 ， 使 用 import * 通常 不 是 一 个 好 方法 ， 因 为 我 们 可 能 无 意 中 
导入 了 与 主 程序 中 的 全 局 名 称 冲突 的 名 称 。 


7.5 类 作为 名 称 空 间 


在 Python 中 ， 每 个 类 都 关联 一 个 名 称 空间 。 在 这 一 节 中 我 们 解释 其 含义 。 我 们 将 特别 
讨论 Python 如 何 巧 妙 地 使 用 名 称 空 间 来 实现 类 和 类 方法 。 

但 首先 ， 为 什么 要 关心 Python 是 如 何 实 现 类 的 呢 ? 我 们 一 直 在 使 用 Python 的 内 置 类 ， 
而 无 须 关 注 其 内 部 原理 。 然 而 ， 有 时 我 们 会 希望 实现 一 个 Python 中 不 存在 的 类 。 第 8 草 将 
讨论 如 何 开发 一 个 新 的 类 。 因 此 ， 了 解 Python 如 何 使 用 名 称 空 间 实 现 类 是 非常 有 用 的 。 


7.5.1 一 个 类 是 一 个 名 称 空间 


在 内 部 ， 一 个 Python 类 本 质 是 一 个 普通 的 名 称 空间 。 名 称 空间 的 名 称 是 类 的 名 称 ， 存 
储 在 名 称 空 间 中 的 名 称 是 类 属性 (例如 ， 类 方法 )。 例 如 ， 类 List 是 名 为 list 的 名 称 空 
间 ， 其 中 包含 1ist 类 的 方法 和 运算 符 的 名 称 ， 如 图 7-16 所 示 。 
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-add__. count pop sort 


名 称 空间 List 





图 7-16 1ist 名 称 空间 及 其 属性 。 类 1ist 定义 了 一 个 名 称 空间 ， 包 括 所 有 列表 运算 符 和 方 
法 。 每 个 名 称 指向 相应 的 函数 对 象 


回顾 前 文 ， 要 访问 一 个 导入 模块 的 属性 ， 我 们 需要 指定 定义 属性 的 名 称 空间 ( 即 模块 
名 称 ): 


>>> import math 
>>> math .pi 
3.141592653589793 


同样 地 ， 类 1ist 的 属性 可 以 使 用 1ist 作为 名 称 空间 来 访问 : 


>>> List,pop 
<method 'pop' of 'list' objects> 
>>> list sort 
<method 'sort' of 'list' objects> 


和 其 他 名 称 空间 一 样 ， 可 以 使 用 内 置 亢 数 dir( ) 查看 定义 在 1ist 名 称 空间 中 的 所 有 
名 称 : 


>>> dir¥ (ligst) 


['__add 3 


'index', "insert', pop', 'remove', 1Teverss1， sort'] 


这 些 是 1ist 类 的 运算 符 和 方法 的 名 称 。 


7.5.2 ”类 方法 是 在 类 名 称 空间 中 定义 的 函数 

现在 我 们 看 看 在 Python 中 如 何 实现 类 方法 。 继 续 使 用 类 1ist 作为 运行 示例 。 假 如 我 
们 希望 对 如 下 列表 排序 : 

PR let = [629,438.47 

在 第 2 革 ， 我们 学 会 了 实现 该 功能 的 方法 : 

S35 "18t. 80rFt () 


现在 我 们 知道 ， 困 数 sort( ) 实际 上 是 定义 在 名 称 空间 List 中 的 一 个 函数 。 事 实 上 ， 
当 Python 解释 需 执 行 语 句 : 


>3> l8t.,sort() 
首先 将 该 语句 翻译 成 : 
> Tist, Sort{tlet) 


洋 试 执行 两 条 语句 ， 你 会 发 现 结果 完全 相同 ! 
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当 在 列表 对 象 1st 上 调用 方法 sort() 时 ， 实 际 上 发 生 的 事情 是 在 列表 对 象 1st 上 调 
用 在 1ist 名 称 空间 中 定义 的 限 数 sort( ) 。 更 一 般 地 说 ，Python 把 通过 类 的 实例 的 方法 调 
用 ， 例 如 : 


instance.method(argl, arg2, ...) 
自动 映射 到 使 用 实例 作为 第 一 个 参数 的 类 名 称 空 间 中 定义 的 明 数 的 调用 : 
class.method(instance, argl, arg2, ...) 


其 中 class 是 instance 的 类 型 。 这 条 语句 是 实际 上 调用 的 话 扣 

让 我 们 使 用 若干 其 他 的 例子 进一步 说 明 。 在 列表 1st 上 的 方法 调用 1st .append(9) 
被 Python 解释 需 翻 译 成 国 数 调用 list.append(1st，9)。 字 由 qd 的 方法 调用 
d.keys( ) 被 翻译 成 Qict.keys(d)。 

从 上 述 例子 可 以 看 出 ， 每 个 类 方法 的 实现 必须 包括 一 个 额外 的 输入 参数 ， 对 应 于 调用 方 
法 的 对 象 实例 。 


7.6 ”电子 教程 案例 研究 : 使 用 调试 着 进行 调试 

在 案例 研究 CS.7 中 ,我 们 展示 了 如 何 使 用 调试 器 查找 程序 中 的 错误 ， 或 者 更 一 般 地 ， 
分 析 程 序 的 执行 情况 。 为 此 ， 调 试 器 提供 了 一 种 方法 : 在 程序 语句 的 任意 位 置 停止 程序 的 执 
行 ， 并 检查 程序 变量 在 该 点 上 的 值 。 特 别 包括 查看 存储 在 程序 栈 帧 中 的 变量 。 


7.7 ”本章 小 结 

本 草 介 绍 了 管理 程序 复杂 性 的 关键 编程 语言 概念 和 结构 。 | 
师 数 和 参数 传递 的 基础 知识 之 上 ， 并 建立 了 一 个 框架 ， 该 框架 将 帮助 读者 在 第 8 草 中 学 
发 新 的 Python 类 以 及 在 第 10 章 中 学 习 递 归 明 数 的 执行 原理 。 

国 数 的 主要 优点 之 一 是 封闭。 封装 谭 循 图 数 的 黑 盒 属 性 : 困 数 除了 通过 调用 参数 (如 果 
有 的 话 ) 和 返回 值 (如果 有 的 话 ) 和 调用 程序 交互 外 ， 不 会 影响 调用 程序 。 郧 数 的 这 个 属性 
成 立 的 原因 在 于 ， 每 个 明 数 调用 都 关联 一 个 独立 的 名 称 空间 ， 因 此 在 顺 数 调用 执行 过 程 中 定 
义 的 变量 名 在 该 限 数 调用 之 外 是 不 可 见 的 。 

程序 的 正常 执行 控制 流 ( 孔 数 调用 其 他 哺 数 ) 需要 通过 OS 使 用 程序 栈 管 理 也 数 调用 名 
称 空间 。 程 订 栈 用 于 跟 踊 活动 孙 数 调用 的 名 称 空间 。 当 异常 发 生 时 ， 程序 的 正常 控制 流 被 中 
汤 ， 并 切换 到 异常 控制 流程 。 默 认 的 异 常 控制 流程 是 中 断 每 一 个 活动 次 数 调用 并 输出 一 条 错 
误 消 息 。 在 这 一 章 中 ， 我们 介绍 了 使 用 try/except 语句 对 进行 异常 处 理 ， 作 为 管理 异常 
控制 流 的 一 种 方法 。 当 有 必要 时 ,将 其 用 作 程 序 的 一 部 分 。 

名 称 空间 与 导入 的 模块 以 及 类 相关 联 ， 如 第 8 章 所 述 ， 对 象 也 是 如 此 。 其 原因 与 明 数 相 
同 : 程序 组 件 的 行为 如 果 像 黑箱 一 样 旦 不 : ee i 则 更 容易 管理 。 把 Python 
的 类 作为 名 称 空间 来 理解 有 助 于 下 一 章 的 学 习 。 下 一 间 我 们 将 学 习 如 何 开 发 新 的 类 。 


7.8 ”练习 题 答 案 


7.1 在 执行 g(3) 的 过 程 中 ， 图 数 调 用 上 (1) 还 没有 终止 ，f(1) 有 一 个 相关 联 的 名 称 空 间 ， 在 该 名 
尔 空 间 ， 定 义 了 局 部 变量 y 和 x， 值 分 别 为 1 和 和 2。 也 数 调用 g(3) 同样 也 有 一 个 相关 联 的 名 称 
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空间 ， 包 含 不 同 的 名 称 y 和 x， 分 别 指 疝 值 3 和 4。 
它们 的 名 称 空间 如 下 图 所 示 。 


商 数 g() 





de f(yy: # 下 是 全 局 名 称 ，y 是 上 () 的 局 部 变量 
> #X 是 E() 的 局 部 变量 
return g(x) #9 是 全 局 名 称 ,x 是 f() 的 局 部 变量 
def g(y) : #9g 是 全 局 名 称 ,，y 是 g( ) 的 局 部 变量 
global x #X 是 全 局 变量 
X= 4 # XX 是 全 局 变量 
return x*y 并 X 是 全 局 变量 ，yY 是 g() 的 局 部 变量 
区 去 站 # Xx 是 全 局 变量 
res = f(x) #res、f 和 x 是 全 局 变量 
print('x = {}, f(t0) = A{}'.F0rmat(x, T6685)) 大同 上 


7.3 因数 的 参数 与 open( ) 函数 的 参数 相同 。 打 开 文 件 和 返回 打开 文件 引用 的 语句 应 该 位 于 try 代 
码 块 中 。 异 第 处 理 程 序 仅 仪 返回 None。 


def safe-open(filename, mode): 
' 返回 文件 filename 的 句柄 ， 如 果 发 生 错 误 ， 则 返回 None ' 
try: 
# 七 YY 语句 块 
infile = open(filename, mode) 
return infile 
except : 
# _ except 语句 块 
return None 


7.4 没有 被 执行 的 语句 如 下 : 


(a) 所 有 的 语句 都 被 执行 。 

(b) h() 和 gf() 的 最 后 一 条 语句 。 

(c) h( ) 的 最 后 一 条 语句 。 

7.5 在 Windows 系统 ， 包 含 模块 random 的 文件 夹 是 cC:\\Python3x\lib,， 根据 使 用 的 Python 
3 的 版 本 不 同 ， 其 中 x 可 能 为 1!1、2、 或 其 他 数字 ; 在 Mac 系统 ， 对 应 的 文件 夹 是 /Library/ 
Frameworks/Python.Framework/Versions/3.x/lib/python31, 

7.6 在 example.py 后 面 添 加 如 下 代码 : 


i name == * main _'"% 
print('Testing module example:') 
人) 
区 () 


print (x) 
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7.9 习题 


7.7 使 用 图 7-5 作为 范例 ， 描 述 果 数 调用 f(1) 的 执行 过 程 ， 以 及 程序 栈 的 状态 。 郴 数 f() 在 模块 
stack .py 中 定义 。 
7.8 ”如 下 程序 有 什么 问题 ? 


模块 : probA.py 


print(f (3)) 
def fx: 
return 2*x+1 


下 一 个 程序 是 否 存 在 同样 问题 ? 


模块 : probB.py 


def g(x): 
print (f(x)) 


4 def f(x): 
return 2*x+1 
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7.9 在 案例 研究 CS.6 中 开发 的 二 十 一 点 扑克 牌 游 戏 应 用 程序 由 五 个 图 数组 成 。 因 此 ， 程 序 中 定义 的 所 
有 变量 都 是 局 部 变量 。 然 而 ， 其 中 一 些 局 部 变量 作为 参数 传递 给 其 他 函数 ， 因 此 它们 引用 的 对 象 是 
(故意 ) 共享 的 。 对 于 每 个 这 样 的 对 象 ， 指 出 该 对 象 在 哪个 水 数 中 创建 ， 以 及 哪些 函数 访问 该 对 象 。 

7.10 本 习题 与 模块 one、two 和 七 hree 相关 : 


模块 : one.py 


import two 


a def f1(): 
two'sE2() 


s def f4(): 
print('Hello!') 


模块 : two.py 


import three 


Of fC) 
three .+3() 


模块 : three.py 
import one 


;def 143{€): 
one.f4() 


当 模 块 one 被 导 人 到 解释 兹 命令 行 后 ， 可 以 执行 £1 ( ): 


>>> import one 
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>>> one.f1() 
Hello! 
ph ms 正确 运行 ， 列 表 sys .path 应 该 包括 存 有 这 3 个 模块 的 文件 夹 。) 使 用 网 7-3 
作为 范例 ， 绘 制 对 应 于 三 个 导入 模块 的 名 称 空间 和 命令 行 名 称 空间 。 描 述 三 个 导入 名 称 空 间 中 
定义 的 名 称 及 其 指向 的 对 象 。 
导入 上 一 道 习 题 的 模块 one 之 后 ， 可 以 查看 one 的 属性 : 
>>> dir(one) 
下 a 
i 
然而 ,我 们 不 能 使 用 同样 的 方法 查看 two 的 属性 : 
>>> dir(two) 
Traceback (most recent call last) : 
File "<pyshell#202>", line 1, in <module> 
dir (two) 
NameError: name 'two' is not defined 
为 什么 呢 ? 注意 导入 模块 one 强制 导入 模块 two 和 three。 如 何 使 用 曙 数 dir( ) 查看 它 
们 的 属性 ? 
使 用 图 7-2 作为 范例 ， 描 述 明 数 调 用 one .fl() 的 执行 流程 。 盟 数 £1( ) 定义 在 模块 one .py 中 。 
修改 案例 研究 CS.6 中 的 模块 blackjack.py， 使 得 当 模 块 作为 顶层 模块 运行 时 ， 调 用 果 数 
blackjack()( 换 言 之， 开始 二 十 一 点 扑克 牌 游戏 )。 通 过 在 系统 的 命令 行 中 运行 程序 以 测试 
你 的 解决 方案 : 
> python blackjack.py 
House: 7 而 8 个 
You: 10 而 J] 后 
Hit or stand? (default: hit): 


假设 列表 1st 为 : 
>>2 Tt = [2,.3,4,5j 


把 下 列 列表 方法 调用 翻译 成 相应 的 命名 空间 List 中 的 困 数 调用 : 
(a)lst.sort() 
(b)lst.append(3) 
(c)lst.count(3) 
(d)lst.insert(2, 1) 
把 下 列 字符 串 方 法 调用 翻译 成 相应 的 命名 空间 str 中 的 函数 调用 : 
(a)'error'.upper() 
(b)'2,3,4,5'.split(",') 
(c)'mississippi'.count('1') 
(d)'bell'.replace('e','a') 
(e)' '.format( 1,2,3) 


7.10 思考 题 


fl 


思考 题 6.27 中 的 函数 index( ) 的 第 一 个 输入 参数 应 该 为 一 个 文本 文件 名 。 如 果 解 释 硕 找 不 到 该 
文件 或 者 无 法 读 取 该 文件 ， 将 引发 一 个 异常 。 重 新 实现 函数 index( ) ， 使 得 结果 输出 如 下 信息 : 


S555 index('rven. txt's L'raven's, 'mortal’, “YL ghost ']) 
File 'rven.txt' not found. 


hak 


7.20 


3 
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在 思考 题 6.35 中 ， 要 求 读 者 开发 一 个 应 用 程序 ， 请 求 用 户 求解 加 法 运算 问题 。 要 求 用 户 使 用 数 
字 0 到 9 输入 答案 。 
重新 实现 函数 game ( ) 以 处 理 用 户 输入 非 数字 的 情况 ， 并 输出 友好 的 提示 信息 ， 例 如 :“ 请 
使 用 数字 0 到 9 输入 答案 。 请 重 试 一 次 !1”， 为 用 户 提 供 重新 输入 答案 的 机 会 。 
>>> game(3) 
中 由 有 三 
请 输入 答案 : ten 
请 使 用 数字 0 到 9 输入 答案 。 请 重 试 一 次 ! 
请 输入 答案 : 10 
正确 。 
在 案例 研究 CS.6 中 开发 的 二 十 一 点 扑克 牌 游戏 应 用 程序 包含 dealcard( ) 因数 ， 用 于 从 一 副 
牌 的 顶部 弹出 一 张 扑克 有 牌 并 发 给 游戏 参与 者 。 一 副 牌 采用 扑克 牌 列表 的 形式 实现 ， 从 一 副 扑克 
牌 弹出 顶部 的 扑克 牌 对 应 于 列表 的 pop 操作 。 如 果 顺 数 在 一 副 空 的 扑 殉 牌 上 调用 ， 即 尝试 弹出 
一 个 空 的 列表 ， 将 会 引发 IndexError 错误 。 
修改 二 十 一 点 扑克 牌 游戏 应 用 程序 ， 处 理 当 试图 从 一 副 空 的 扑克 有 牌 发 牌 时 引发 的 异常 。 要 
求 异 党 处理 程序 创建 一 副 新 的 洗 好 的 牌 ， 并 从 新 牌 的 顶部 发 一 张 牌 。 
实现 函数 inValues ( ) ， 请 求 用 户 输入 若干 非 零 浮 点 数 。 当 用 户 输 入 的 值 不 是 数值 时 ， 重 新 给 
用 户 提 供 一 次 输入 机 会 。 如 果 连 续 发 生 两 次 错误 ， 则 退出 程序 。 当 用 户 输入 0 时， 要求 函数 返 
回 用 户 输入 的 所 有 正确 值 的 和 。 使 用 异常 处 理 程序 检测 非法 输入 。 
>>> inValues() 
Please enter a number: 4.75 
Please enter a number: 2,25 
Error. Please re-enter the value. 
Please enter a number: 2.25 
Please enter a number: 0 
:OO 
>>> inValues() 
Please enter a number: 3.4 
Please enter a number: 3,4 
Error. Please re-enter the value. 


Please enter a number: 3,4 
Two errors in a row. Quitting ... 


在 思考 题 7.19 中 ， 仅 当 用 户 连续 输入 两 次 错误 时 程序 才 退 出 。 实 现 该 程序 的 另 一 个 版 本 ， 当 用 
户 两 次 输入 错误 时 (即使 前 一 次 输入 正确 )， 也 退出 程序 。 

当 在 命令 行 执行 Input ( ) 困 数 时 ， 如 果 按 【Ctrl+C ] 键 ， 将 引发 一 个 KeyboardInterrupt 
异 津 。 例 如 : 

>>> x = input() # 按 【Ctrl + C ]】 键 

Traceback (most recent call last): 


File “<stdin>", line 1, in <module> 
KeyboardInterrupt 


创建 一 个 封装 郴 数 safe_input() ， 其 功能 与 果 数 input ( ) 类 似 , 不 同 之 处 是 当 引 发 异 
第 时 什么 也 不 返回 。 


>>> x = Safe_input() # 按 【Ctrl + C] 键 


> #X 为 None 
>>> x = Safe_input()  ## 键 入 34 
34 


>>> x #X 为 34 
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本 童 描述 如 何 实现 新 的 Python 类 ， 并 介绍 面向 对 象 程序 设计 (OOP )。 

程序 设计 语言 (例如 Python) 允许 开发 人 员 定 义 新 的 类 有 若干 原因 。 为 特定 应 用 程序 定 
制 的 类 将 使 应 用 程序 更 直观 且 更 容易 开发 、 调 试 、 阅 读 和 维护 。 

创建 新 类 的 能 力也 提供 了 一 种 构建 应 用 程序 的 新 方法 。 函 数 公 开 用 户 的 行为 ， 但 封装 
( 即 隐藏 ) 其 实现 。 类 似 地 ， 类 向 用 户 公 开 可 以 应 用 于 类 对 象 的 方法 ， 但 封装 了 包含 在 对 象 
中 的 数据 的 存储 方式 ， 以 及 类 方法 的 实现 细节 。 由 于 每 个 类 和 对 象 都 与 细 粒 度 定制 的 名 称 空 
间 相 关联 ， 因 此 实现 了 类 的 这 种 属性 。OOP 是 一 种 软件 开发 理念 ， 通 过 把 应 用 程序 组 织 ; 
组 件 (类 和 对 象 ) 来 实现 模块 化 和 代码 可 移植 性 。 


8.1 定义 新 的 Python 类 


现在 我 们 将 解释 如 何 用 Python 定义 一 个 新 类 。 我 们 开发 的 第 一 个 类 是 类 Point ， 一 个 
表示 平面 上 (你 也 可 以 认为 是 地 图 上 ) 的 点 的 类 。 更 确切 地 说 ， 类 Point 的 对 象 对 应 于 二 
维 平面 中 的 一 个 点 。 回 想 一 下 , 平面 上 的 每 个 点 都 可 以 用 它 的 x 轴 上 坐标 和 yy 轴 坐 标 来 指定 ， 
如 图 8-1 所 示 。 





图 8-1 平面 上 的 一 个 点 。Point 类 型 的 对 象 表示 平面 上 的 一 个 点 。 一 个 点 由 其 x 坐标 和 ?y 坐 
标 来 定义 


实现 类 Point 之 前 ， 我 们 需要 先 确 定 其 行为 ， 即 其 支持 哪些 方法 。 


8.1.1 类 Point 的 方法 

让 我 们 描述 一 下 如 何 使 用 类 Point。 要 创建 一 个 Point 对 象 ， 可 以 使 用 Point 类 的 
默认 构造 函数 。 这 与 使 用 1ist( ) 或 int () 的 默认 构造 函数 来 创建 一 个 列表 或 整数 对 象 完 
全 一 致 。 

>>> point = Point() 
(温馨 提示 : 我 们 还 没有 实现 类 Point， 这 里 的 代码 只 是 为 了 说 明 我 们 希望 类 Point 如 何 
表现 ,) 

创建 了 一 个 Point 对 象 之 后 ,我 们 将 使 用 方法 setx() 和 sety() 设置 其 坐标 : 


>>> point.setx(3) 
>>> point.sety(4) 
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此 时 ，Point 对 象 point 有 了 自己 的 坐标 。 我 们 可 以 使 用 方法 get ( ) 来 检查 : 


>>> point.get() 
(3, 4) 


方法 get() 将 返回 point 的 坐标 ， 结 果 为 一 个 元 组 对 象 。 现 在 ， 要 把 point 下 移 三 
个 单位 ， 我 们 可 以 使 用 方法 move ( ): 
>>> point .move(0,-3) 


>>> point .get() 
(3 19 


我 们 还 可 以 改变 point 的 坐标 : 


>>> point.sety(-2) 
>>> point.get() 
(3, -2) 


总 结 我 们 希望 类 Point 支持 的 方法 如 表 8-1 所 示 。 
表 8-1 类 Point 的 方法 。 其 中 说 明了 类 Point 的 四 种 方法 的 使 用 方式 。point 指向 





Point 类 型 的 对 象 
point.setx(xcoord) 把 point 的 x 坐标 设置 为 xcoord 
point.sety(ycoord) | 把 point 的 y 坐标 设置 为 ycoord 


point .get() | 返回 point 的 x 坐标 和 yy 坐标， 结果 为 一 个 元 组 (x，y) 


把 point 的 坐标 从 当前 值 (x，y) 修改 为 (x+dx，y+dy) 





move(dx, dy) 


8.1.2 ”类 和 名 称 空间 


正如 我 们 在 第 7 章 中 所 了 解 到 的 ， 每 个 Python 类 有 一 个 名 称 空 间 与 之 相关 联 ， 名 称 空 
间 的 名 称 是 类 的 名 称 。 名 称 空间 的 目的 是 存储 类 属性 的 名 称 。 类 Point 有 一 个 相关 联 的 名 
为 Point 的 名 称 空间 。 这 个 名 称 空间 包括 类 Point 的 名 称 ， 如 图 8-2 所 示 。 


setx sety get move 








类 Point 的 名 称 空间 











setxO [so ereo| 
图 8-2 类 Point 及 其 属性 。 定 义 类 Point 时 ， 同 时 定义 了 与 类 相关 联 的 名 称 空间 ， 这 个 名 
称 空间 包括 类 的 属性 
图 8-2 显示 了 名 称 空间 Point 中 的 每 个 名 称 如 何 指 回 一 个 困 数 的 实现 。 让 我 们 考虑 图 
数 setx() 的 实现 。 
在 第 7 章 ， 我 们 了 解 到 Python 把 一 个 如 下 的 方法 调用 
>>> point .setXx(3) 


翻译 成 : 


>>> Point.setx(point, 3) 


所 以 ，setx( ) 是 一 个 定义 在 名 称 空间 Point 中 的 函数 。 它 包含 两 个 而 不 是 一 个 参数 : 调 
用 该 方法 的 Point 对 象 , x 坐标 。 因 此 ，setx() 的 实现 应 该 类 似 于 下 和 面 所 示 : 


def setx(point, xcoord).: 


# Setx 的 具体 实现 
限 数 setx( ) 应 该 存储 x 坐标 值 xcoord， 以 便 后 续 能 够 访问 (例如 ， 通 过 方法 get() 
访问 )。 遗 憾 的 是 ， 下 面 的 代码 并 不 能 实现 存储 功能 : 


def setx(point, xcoord): 
X = xcoord 


因为 x 是 一 个 局 部 变量 ， 一 旦 函数 调用 setx( ) 终止 ，x 就 会 消失 。 那 么 ，xcoord 的 
值 应 该 保存 在 何 处 以 便 后 续 代 人 码 访问 呢 ? 


8.1.3 每 个 对 象 都 有 一 个 关联 的 名 称 空 间 


我 们 知道 每 个 类 都 有 一 个 相关 联 的 名 称 空间 。 事 实 上 ， 不 仅仅 是 类 ， 每 个 Python 对 象 
也 有 自己 独立 的 名 称 空间 。 当 我 们 初始 化 一 个 Point 类 型 的 新 对 象 并 赋值 给 一 个 名 称 Point 
时 ， 例 如 : 


>>> point = Point() 


将 创建 一 个 名 为 point 的 名 称 空 间 ， 如 图 8-3a 所 示 。 


X 
对 象 Point 的 名 称 空间 | Point 的 名 称 空间 
Er 
EE 
a) b) 
图 8-3 一 个 对 象 的 名 称 空间 。a) 每 个 Point 对 象 都 有 一 个 名 称 空间 。b) 语句 point .x=3 把 


3 赋值 给 定义 在 名 称 ei et oe 
因为 一 个 名 称 空间 与 对 象 point 关联 ， 所 以 我 们 可 以 使 用 它 来 存储 但 : 
>>> point.x = 3 
这 条 语句 在 名 称 空 间 point 中 创建 名 称 x， 并 赋值 为 一 个 整数 对 和 象 ， 如 图 8-3b 
所 示 。 


让 我 们 回 到 方法 setx( ) 的 实现 。 我 们 现在 有 了 一 个 保存 Point 对 象 的 x 坐 标的 地 
方 。 我 们 把 它 保存 在 相关 联 的 名 称 空间 中 。 方 法 setx( ) 可 以 实现 如 下 : 


def setx(point, xcoord): 
point.x = xcoord 


8.1.4 类 Point 的 实现 
现在 我 们 准备 好 编写 类 Point 的 实现 了 : 
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模块 : ch8.py 


class Point: 
， 表示 平面 上 点 的 类 ， 
def setx(self, xcoord): 
' 把 点 的 x 坐标 没 置 为 xcoord ， 
self.x = xcoord 
def sety(self, ycoord): 
， 把 点 的 y 坐标 设置 为 ycoord ， 
self.y = ycoord 
def get(self) : 
' 返回 点 的 x 坐标 和 Yy 坐标 ， 结 果 为 元 组 ， 
return (self.x, self.y) 
def move(self, dx, dy): 
， 把 x 坐标 和 Yy 上 坐标 改变 为 dx 和 dy ， 
Se 天 二 = 
self.y += dy 


保留 关键 字 class 用 于 定义 一 个 新 的 Python 类 。class 语句 与 def 语句 十 分 类 似 。 
一 个 def 请 名 定义 一 个 新 的 函数 并 赋予 该 国 数 一 个 名 称 ; 一 个 class 语句 定义 一 个 新 的 类 
型 并 赋予 该 类 型 一 个 名 称 。( 两 者 与 赋值 语句 类 似 ， 为 一 个 对 象 赋 予 一 个 名 称 。) 

烷 跟 在 class 关键 字 后 的 是 类 的 名 称 ， 正 如 def 语句 后 跟 浮 数 名 称 。 与 阴 数 定义 的 男 
一 个 相似 之 处 是 class 语句 下 面 的 文档 字符 串 ， 将 由 Python 解释 器 处 理 ， 作 为 类 的 文档 的 
一 个。 

类 由 其 属性 定义 。 类 属性 (例如 ， 类 Point 的 四 个 方法 ) 定义 在 语句 “class Point:” 
下 面 的 缩 进 语句 块 中 。 

每 个 类 方法 的 第 一 个 输入 参数 指 同调 用 该 方法 的 对 象 。 我 们 已 经 实现 了 方法 setx( ): 

def setx(self, xcoord): 

' 把 点 的 x 坐标 设置 为 xcoord ， 
self.x = xcoord 

我 们 修改 了 一 处 实现 代码 。 指 向 调用 方法 setx( ) 的 Point 对 象 的 第 一 个 参数 被 命名 
为 elf WU 下 有 pedite 实际 上 贡 一个 克 攻 的 和亲 以 全 天 。 关 刍 在 于 它 指向 关 用 该 

的 对 象 。 然 而 ，Python 开发 人 员 齐 循 的 惯例 是 使 用 名 称 self 表示 调用 该 方法 的 对 象 ， 我 
a 陆 例 。 

方法 sety( ) 和 方法 setx() 类 似 : 它 把 y 坐标 存储 在 变量 y 中 ， 变 量 y 同样 定义 在 
调用 对 和 象 的 名 称 空间 中 。 方 法 get( ) 返回 定义 在 调用 对 象 名 称 空间 中 的 变量 x 和 yy 的 值 。 
最 后 ， 方 法 move( ) 改变 与 调用 对 和 象 关联 的 变量 x 和 yy 的 值 。 

现在 我 们 测试 新 建 的 类 Point。 首 先 通 过 运行 模块 ch8 .py 执行 类 定义 ， 然 后 尝试 如 
下 操作 : 


>>> a = Point() 
>>> a.setx(3) 
>>> a.sety(4) 
>>> a.get() 

(3 直 ) 


向 类 Point 中 添加 方法 getx( )。 该 方法 不 带 输入 参数 ， 返 回调 用 该 方 
法 的 Point 对象 相关 联 的 关 坐 标 。 





>>> a.getx() 
3 


8.1.5 ”实例 变量 


定义 在 一 个 对 象 的 名 称 空间 中 的 变量 (例如 在 Point 对 象 a 中 的 变量 x 和 y) 称 为 实 
例 变量 。 每 个 类 的 实例 (对 象 ) 都 有 目 己 的 名 称 空 间 ， 因 此 有 具有 各 目 独 立 的 实例 变量 副本 。 
例如 ， 假 如 我 们 创建 第 二 个 Point 对 象 如 下 : 


>» YB = Point() 
>>> Db,setx(5) 
>>> b.sety(-2) 


实例 变量 a 和 pb 将 各 自 具有 自己 的 实例 变量 x 和 y 的 副本 ， 如 图 8-4 所 示 。 


对 象 b 





图 8-4 实例 变量 。 类 型 Point 的 每 个 对 象 具有 其 独自 的 实例 变量 ， 存 储 在 与 对 象 相关 联 的 名 称 空间 
事实 上 ， 实 例 变量 x 和 y 可 以 通过 指定 相应 的 实例 来 访问 : 


> 
3 
S> Di 
5 


当然 ， 也 可 以 直接 改变 其 值 : 


>>> 8 过 了 
> 4 
7 


8.1.6 ”实例 继承 类 属性 


名 称 a 和 b 指 向 类 型 Point 的 对 象 ， 因 此 a 和 bb 的 名 称 空间 应 该 与 Point 名 称 空 
间 有 某 种 关联 ，Point 名 称 空 间 包 含 可 以 在 对 象 a 和 b 上 调用 的 类 方法 。 我 们 可 以 使 用 
Python 函数 dir( ) 进行 验证 。 第 7 章 介 绍 了 dir() 函数 ， 该 函数 带 一 个 名 称 空间 作为 参 
数 并 返回 定义 在 该 名 称 空间 中 的 名 称 列表 : 


>>> dir(a) 
| 0 


'__weakref i et Manove', nob! , "suty's ml,, yt] 
.es 人 机 “ 


(省 略 了 奉 干 行 输出 内 容 。) 
和 预期 一 样 ， 列 表 中 包含 实例 变量 x 和 y。 但 同时 也 包含 Point 类 的 方法 : setx、 
sety、get 和 move。 我 们 称 对 象 a 继承 了 类 Point 的 所 有 属性 ， 就 像 孩 子 继 承 父 母 的 属 
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性 一 样 。 因 此 ， 类 Point 的 所 有 属性 均 可 以 通过 名 称 空间 a 来 访问 。 让 我 们 验证 如 下 : 


>>> a.setx 
<bound method Point.setx of <__main__.Point object at Oxi1l4b7efO0>> 


setx sety get move 
Eo i 
类 Point 
Xx TY Xx y 
Ea [| | 
对 象 a 对 象 


图 8-5 示例 和 类 属性 。 类 型 Point 的 每 个 对 象 都 有 其 独 目的 实例 变量 x 和 y。 它 们 均 继 承 类 
Point 的 所 有 属性 


对 象 a、b 和 类 Point 的 名 称 空间 的 关系 如 图 8-5 所 示 。 理 解 如 下 概念 十 分 重要 : 方法 
名 称 setx、sety、get 和 move 定义 在 名 称 空间 Point， 而 不 是 定义 在 名 称 空 间 a 或 者 
b 中 。 因 此 ， 当 对 表达 式 a.setx 求 值 时 ，Python 解释 器 使 用 如 下 步骤 : 

1. 首先 尝试 在 对 象 a (名 称 空间 ) 中 查找 名 称 setx。 

2. 如 果 在 名 称 空 间 a 中 不 存在 setx， 则 尝试 在 名 称 空间 Point 中 查找 setx (并 且 查 
找到 ) 。 


8.1.7 ”类 定义 的 一 般 格式 
类 定义 语句 的 语法 格式 如 下 : 
class < 类 名 称 >: 


攻关 变量 1> = <valueS> 
< 类 变量 2> = <Value> 


def < 类 方法 12>(5681f argii, argl2, 6s1:): 


< 类 方法 1 的 实现 > 
def < 类 方法 2>(self，。 arg21, arg22, sj: 


< 类 方法 2 的 实现 > 


(后 续 草 节 将 讨论 其 更 一 般 的 格式 。) 

一 个 类 定义 的 第 一 行为 class 关键 字 后 跟 < 类 名 称 >， 即 类 的 名 称 。 在 上 例 中 ， 类 名 
称 是 Point。 

第 一 行 之 后 是 类 属性 的 定义 。 人 类 属性 可 以 是 类 方法 或 者 
类 变量 。 在 类 Point 中 定义 了 四 个 类 方法 ,但 没有 定义 类 变量 。 类 变量 是 定义 在 类 的 名 称 
空间 中 的 变量 。 


得 在 解释 器 命令 行 中 ， 先 定义 类 Test， 然 后 创建 Test 的 两 个 实例 : 


>>> Class Teste 
version = 1.02 
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>>> a = Test() 
35335 B= Test () 


类 Test 只 有 一 个 属性 ， 即 类 变量 version， 指 向 一 个 浮 点 值 1.02。 

(a) 绘制 与 类 和 两 个 对 象 相关 联 的 名 称 空间 、 其 中 包含 的 名 称 (如 果 有 的 话 )， 以 及 名 称 
指向 的 值 (如 果 有 的 话 )。 

(b) 执行 下 列 语句 ， 并 补充 问号 位 置 的 内 容 : 


>>> a.version 
>>> b.version 
>>> Test .version 


>>> Test .version=1.03 
>>> a.version 


>>> Point.version 


>>> a.version = 'Lateéstt!t!' 
>>> Point.version 


>>> b.version 


>>> a.version 
Ye? 


(Cc) 绘制 执行 上 述 语 句 之 后 的 名 称 空 间 的 状态 。 请 解释 最 后 三 个 表达 式 为 什么 出 现 了 这 
样 的 求 值 结果 。 


8.1.8 编写 类 的 文档 


为 了 能 够 通过 help() 工具 获取 有 用 的 文档 信息 ， 为 一 个 新 的 类 正确 编写 文档 十 分 重 
要 。 我 们 定义 的 类 Point 包含 一 个 文档 字符 串 ， 每 个 方法 也 有 一 个 文档 字符 串 : 


>>> help (Point) 


Help on class Point in module ._main_..: 


class Point(builtins.object) 
| 表示 平面 上 点 的 类 
| 
Methods defined here: 


| 
| 
| get(self) 
| 返回 点 的 x 和 yy 坐标， 结果 为 元 组 
| 


(省 略 了 剩余 的 输出 内 容 。) 
8.1.9 类 Animal 


在 继续 下 一 节 之 前 ， 让 我 们 把 迄今 为 止 所 学 的 一 切 付 诸 实践 ， 开 发 一 个 叫 作 Animal 
的 新 类 ， 它 是 动物 的 抽象 ， 并 文 持 如 下 三 种 方法 : 
e SetSpecies(species): 把 动物 对 象 的 种 类 设置 为 species。 
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e setLanguage (language): 把 动物 对 象 的 语言 设置 为 1anguage。 
e speak(): 输出 如 下 所 示 的 有 关 动 物 的 信息 。 
通过 如 下 示例 展示 类 的 表现 行为 : 


>>> snoopy = Animal() 

>>> snoopy.setSspecies('dog') 
>>> snoopy.setLanguage('bark') 
>>> snoopy.speak() 

I am a dog and I bark. 


首先 编写 类 定义 的 第 一 行 : 
class Animal: 


后 在 缩 进 代码 块 中 和 定义 三 个 类 方法 。 首 先 编写 setSpecies()。 虽 然 方法 
setSpecies( ) 使 用 一 个 参数 (动物 的 种 类 species), 但 是 必须 定义 为 带 两 个 输入 参数 
的 函数 ， 指向 调用 方法 的 对 象 的 self 参数 和 species 参数 。 


def setSpecies(self, species): 
self.species = species 


注意 ， 我 们 把 实例 变量 命名 为 species， 这 和 局 部 变量 species 同名 。 因 为 实例 
变量 定义 在 self 的 名 称 空间 ， 而 局 部 变量 定义 在 浮 数 调用 的 名 称 空间 ， 故 二 者 不 会 产生 
冲突 。 
方法 setLanguage( ) 的 实现 和 setSpecies() 类 似 。 方 法 speak() 不 带 输入 参 
数 ， 因 此 其 定义 只 有 一 个 输入 参数 self。 类 的 最 终 实现 代码 如 下 : 


AN 


模块 : ch8.py 


class Animal: 


' 表示 一 个 动物 ， 


def setSpecies(self, species): 
”设置 动物 的 种 类 ， 


Self.Spec = Species 


def setLanguage(self, language): 
”设置 动物 的 语言 
self.lang = language 


def speak(self): 
”输出 动物 发 出 的 声音 ， 
print('I am a {} and I {}.'.format(self.spec, self.lang)) 


实现 表示 短 形 的 类 Rectangle。 类 支持 的 方法 如 下 : 

e setSize (width, length): 带 两 个 输入 参数 ， 设 置 矩 形 的 宽度 和 长 度 。 
e perimeter(): 返回 德 形 的 周 长 。 

e areal(): 返回 矩形 的 面积 。 


>>> rectangle = Rectangle(3,4) 
>>> rectangle.perimeter() 
14 


>>> Tectangle.area() 
12 


8.2 用户 自 定 义 类 示例 
为 了 更 加 熟悉 如 何 设计 和 实现 一 个 新 类 ， 在 本 节 中 我 们 将 阐述 实现 几 个 类 的 过 程 。 但 首 
先 ， 我 们 将 解释 如 何 使 得 创建 和 初始 化 新 对 象 更 容易 。 


8.2.1 构造 函数 重 载 

让 我 们 重新 审视 上 一 市 开发 的 类 Point。 要 创建 一 个 位 于 (x，y) 坐标 为 (3，4) 的 点 的 
Point 对 象 ， 我 们 需要 分 别 执行 如 下 三 条 语句 : 

>>> a = Point() 


>>> a, Setx(3) 
>>> a.sety(4) 


第 一 条 语句 创建 Point 的 一 个 实例 ， 剩 余 的 两 行 代码 初始 化 其 zx 和 yy 坐标。 在 某 个 位 
置 创 建 一 个 Point 对 象 需要 好 几 个 步 又 。 如 果 可 以 把 实例 化 和 初始 化 合并 成 一 个 步 又， 则 
代码 会 更 简洁 优美 : 

>>> a = Point(3,4) 

我 们 已 经 见 过 允许 创建 对 象 的 同时 初始 化 其 值 的 类 型 。 整 型 可 以 在 创建 的 同时 初 
始 化 : 

>>> x = int(93) 


ca 和 
93 


同样 ， 内 置 fractions 模块 中 的 Fraction 类 型 的 对 象 也 是 如 此 : 


>>> import fractions 

>>> x = fractions.Fraction(3,4) 
》>》 受 

Fraction(3,. 4) 


读 输 入 参数 的 构造 曙 数 非常 有 用 ， 因 为 它们 可 以 在 对 象 实例 化 时 初始 化 对 象 的 状态 。 

为 了 能 够 使 用 一 个 市 输入 参数 的 Point() 构造 吨 数 ， 必 须 在 类 Point 的 实现 中 显 式 
添加 名 为 ”_init  () 的 方法 。 当 添加 该 特殊 方法 到 类 中 后 ， 每 当 创 建 对 象 时 ，Python 
解释 熏 就 会 日 动 调用 它 。 换 句 话 说 ， 当 Python 执行 : 

Point (3,4) 
解释 需 将 首先 创建 一 个 “ 空 ” 的 Point 对 象 ， 然 后 执行 : 

Welds. .0it (4 
其 中 ，self 指 癌 新 创建 的 Point 对 象 。 注 意 , 既然 。” init _() 是 带 两 个 输入 参数 的 
类 Point 的 方法 ， 因 此 定义 限 数 _ _init__() 时 ， 也 必须 市 两 个 输入 参数 ， 外 加 必需 的 
参数 self: 
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模块 : ch8.py 
class Point : 
' 表示 平面 上 点 的 类 ， 
def __init__(self, xcoord, ycoord): 


， 初始 化 点 坐标 为 ( xcoord ，ycoord ) ， 
self.x xcoord 
Self.y = ycoord 


# 方法 setx ()、sety ()、get () 和 move () 的 实现 


注意 事项 : 每 次 创建 一 个 对 象 时 都 会 调用 函数 _init _() 
因为 每 次 实例 化 一 个 对 象 时 都 会 调用 init _() 方法， 所 以 调用 Point() 构造 
函数 时 必须 带 两 个 参数 。 这 意味 着 不 带 参 数 调 用 构造 函数 将 导致 错误 : 
>>> a = Point() 


Traceback (most recent call last): 


File "<pyshell#23>", line 1, in <module> 
a = Point() 


TypeError: __init__() takes exactly 3 positional arguments 
(1 given) 


也 可 以 重 写 _init _() 函数 ， 使 得 其 可 以 处 理 两 个 参数 、 一 个 参数 ， 或 不 带 参 
数 。 请 读者 继续 阅读 下 文 。 


8.2.2 ”默认 构造 函数 
我 们 了 解 到 调用 内 置 类 的 构造 函数 可 以 带 参数 也 可 以 不 带 参数 : 


> Tnt(3) 
3 

> > 
0 


我 们 也 可 以 在 用 户 目 定义 类 上 实现 。 只 需要 在 盟 数 未 提供 输入 参数 时 ， 指 定 xcoord 


和 ycoord 的 默认 值 即 可 。 在 如 下 重新 实现 的 ” init _() 方 法 中 ,我 们 指定 了 默认 
值 0: 


模块 : ch8.py 


class Point 


， 表示 平面 上 点 的 类 ， 


def __init__(self，Xxcoord=0，ycoord=0) : 
' 初始 化 点 坐标 为 ( xcoord ，ycoord ) ， 
self.x = xcoord 
self.y = ycoord 


# 方法 setx ()、sety ()、get () 和 move () 的 实现 


该 Point 构造 男 数 现在 可 以 带 两 个 输入 参数 : 


>>> a = Point (3,4) 
>>> a.get() 
(3, 4) 


A 


y 


人 


部 8 莫 


或 者 不 市 输入 参数 .: 

>>> 5 二 Point () 

>>> b.get() 

(0 0) 

或 者 只 带 一 个 输入 参数 : 


>>> C = Point (2) 
>>> c.get() 
(2; 9) 


Python 解释 器 从 左 到 右 把 构造 函数 参数 赋值 给 局 部 变量 xcoord 和 ycoord。 
8.2.3 ”扑克 上 牌 类 


在 第 6 章 ， 我们 开发 了 一 个 二 十 一 点 扑克 有 牌 游戏 应 用 程序 。 我 们 使 用 字符 串 (如 “3%”) 
表示 扑克 牌 。 现 在 我 们 掌握 了 如 何 开 发 新 类 型 ， 所 以 理所当然 可 以 开发 一 个 card 类 来 表示 
扑克 有 牌 。 

该 类 应 该 支持 一 个 带 两 个 参数 的 构造 函数 用 于 创建 Card 对 象 : 


>>> eard = Card('3', '\u2660") 


字符 串 ' \u2660' 是 表示 Unicode 字符 @ 的 转 义 字符 序列 。 该 类 还 应 该 文 持 用 于 获取 
Card 对 象 的 牌 面 大 小 (点数 ) 和 花色 : 


>>> card.getRank() 


~ 


人 
>>> card.getSuit() 


篇 
上 述 方 法 已 经 足够 。 我 们 希望 类 card 文 持 如 下 方法 : 
e Card(rank，suit): 构造 也 数 ,初始化 扑 元 牌 的 点 数 和 花色 
e getRank(): 返回 扑克 有 牌 的 点 数 
e getSuit(): 返回 扑 殉 牌 的 花色 
注意 ， 构 造 函 数 指定 为 带 两 个 输入 参数 。 我 们 没有 为 rank 和 suit 提供 默认 全， 因为 
不 清楚 默认 扑克 牌 究 竞 是 什么 。 类 的 实现 如 下 : 


模块 : Card.py 
! Class Card: 


， 表示 一 张 扑克 牌 ， 


dar nt (nolt, Tank, Built 
' 初始 化 扑克 有 牌 的 点 数 和 花色 ， 
self.rank = rank 
self.suit = suit 


de 


Fh 


getRank (self ): 
' 返回 点 数 ， 


return self.rank 


def getSuit(self):. 
' 所 回 花 和 多 ， 


return self .suit 
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注意 ,方法 __init__() 实现 为 带 两 个 参数 ， 分 别 为 要 创建 的 扑克 牌 的 点 数 和 花色 。 


用: 演 葬 训 光 国 修改 在 上 一 节 开 发 的 类 Animal， 使 得 其 支持 两 个 、 一 个 ， 或 不 带 输入 参 
数 的 构造 函数 : 

>>> snoopy = Animal('dog', 'bark') 

>>> snoopy.speak() 

1 am a dog and 1 bark. 

>>> tweety = Animal('canary') 

>>> tweety .speak() 

I am a canary and I make sounds. 

>>> animal = Animal() 

>>> animal .speak() 

I am an animal and I make sounds. 


8.3 设计 新 的 容 希 类 


尽管 Python 提供 了 一 组 不 同 的 容 融 类 ， 但 还 是 需要 开发 适合 特定 应 用 程序 的 容 需 类 。 
我 们 使 用 表示 一 副 扑 克 牌 的 类 以 及 典型 的 队列 容 需 类 ， 来 阐述 如 何 设计 新 的 容器 类 。 


8.3.1 设计 一 个 表示 一 副 扑 克 牌 的 类 


我 们 再 次 使 用 第 6 章 中 的 二 十 一 点 扑 殉 牌 游 戏 应 用 程序 来 带动 下 一 党课 。 在 二 十 一 点 
扑 殉 牌 激 戏 应 用 程序 中 ， 一 副 扑 殉 牌 使 用 一 个 列表 来 实现 。 要 实现 洗 牌 操作 ， 我 们 使 用 
random 模块 中 的 shuffle() 方法 。 发 牌 使 用 1ist 方 法 pop()。 简 而 言 之 ， 二 十 一 点 
扑克 牌 游戏 应 用 程序 使 用 非 应 用 程序 术语 和 操作 来 编写 实现 。 

如 果 隐 藏 1ist 容 锅 和 操作 ， 使 用 Deck 类 和 Deck 方法 来 编写 ， 则 二 十 一 点 扑克 牌 游 
戏 应 用 程序 将 更 容易 阅读 理解 。 因 此 让 我 们 来 开发 这 样 一 个 类 。 但 是 首先 ， 我 们 和 希望 Deck 
类 如 何 操作 呢 ? 

首先 ,我们 应 该 可 以 使 用 默认 构造 明 数 获得 一 副 标 准 的 52 张 扑克 牌 : 

>>> deck = Deck() 

该 类 应 该 文 持 一 个 洗 牌 的 方法 : 

>>> deck.shuffle() 

该 类 还 应 该 文 持 一 个 从 一 副 牌 的 上 面 发 牌 的 方法 。 

>>> card = deck.dealCard() 

>>> (card.getRank(), card.getSuit()) 

("me 

>>> card = deck.dealCard() 

>>> (card.getRank(), card.getSuit()) 


Bo ty 

>>> card = deck.dealCard() 

>>> (card.getRank(), card.getSuit()) 

(C407, "O01:) 

Deck 类 应 该 文 持 的 方法 包括 : 

e Deck(): 构造 函数 ,初始 化 一 副 牌 为 标准 的 52 张 扑 元 有 牌 
e shuffle(): 洗 牌 


e dealCcard(): 从 一 副 牌 的 项 部 弹出 并 返回 一 张 扑克 有 牌 


8.3.2 ”实现 Deck 类 


我 们 实现 Deck 类 ， 从 Deck 构 造 孔 数 开 始 。 与 上 一 节 的 两 个 例子 (类 Point 和 
card) 不 同 ，Deck 构造 阴 数 不 带 任 何 参 数 。 但 还 是 需要 实现 ， 因 为 其 任务 是 创建 一 副 52 
张 扑 元 牌 并 将 其 存储 在 某 个 位 置 。 

要 创建 52 张 标 准 扑克 牌 的 列表 ， 我 们 可 以 使 用 一 个 舱 套 循环 ， 类 似 于 二 十 一 点 扑 殉 牌 
游戏 应 用 程序 中 的 函数 snuffledDeck ()。 我 们 创建 一 个 suits 集 和 一 个 ranks 集 : 


suits 
ranks 


然后 使 用 一 个 租 套 for 循环 来 创建 每 个 rank 和 suit pp 


or Suit dn suita: 
for rank in ranks: 
# 创建 给 定 rank 和 suit 的 扑克 上牌 并 添加 到 deck 


我 们 需要 一 个 用 于 保存 所 生成 的 扑克 有 牌 的 容 右 。 因 为 一 副 扑 克 牌 中 的 扑 殉 有 牌 的 顺序 有 
意义 ， 而且 应 该 允许 修改 ， 因 此 我 们 同样 选择 第 6 章 二 十 一 点 扑 殉 有 牌 游戏 应 用 程序 使 用 的 
列表 。 

现在 我 们 需要 做 出 一 些 设计 决策 。 首 先 ， 包含 扑克 有 牌 的 列表 是 实例 变量 还 是 类 变量 ?由 
于 每 个 Deck 对 象 应 该 有 自己 的 扑克 牌 列表 ,很 显然 列表 必须 是 实例 变量 。 

我 们 还 有 一 个 设计 决策 需要 解决 : suits 集 和 ranks 集 应 该 定义 在 何 处 ”它们 既 可 以 
是 ”init _() 函数 的 局 部 变量 ， 也 可 以 是 类 Deck 的 类 变量 ,或 者 是 实例 变量 。 由 于 集 
合 不 会 被 修改 ， 且 被 所 有 的 Deck 实例 共享 ， 因 此 我 们 决定 使 用 类 变量 。 

请 读者 重新 阅读 模块 cards .py 中 的 方法 ”init _() 的 实现 。 由 于 集 suits 和 和 集 
ranks 是 类 Deck 的 类 变量 ， 故 它们 定义 在 Deck 名 称 空间 。 因 此 ， 为 了 在 第 12 行 和 第 13 
行 访问 它们 ， 必 须 指 定名 称 空 间 : 


for Suit:. in Deck ,多 七 Si 
for Tank in Deck,.ranks: 


# 创建 给 定 rank 和 suit 的 扑克 上 牌 并 添加 到 deck 
现在 我 们 把 注意 力 转向 类 Deck 的 剩余 两 个 方法 的 实现 。 方 法 shuffle() 只 需要 针对 
实例 变量 self .deck 调用 zandom 模块 也 数 shuffle()。 
对 于 方法 dealcard()， 我 们 需要 确定 一 副 牌 的 顶部 位 于 何 处 。 是 self .deck 列表 
的 头 部 还 是 尾部 ”我 们 决定 使 用 尾部 。 类 Deck 的 完整 实现 代码 如 下 : 


‘Nu2660*, ‘VU2661', "V2662, "WG26683' 了 
1 上 A tt Ire ii 7 1 Ye 4 ' ' 1 
{ 二 > 3 3 “人 9 OO 》 Bs | 》 3 y 9 » 10 y J 》 AU A } 


模块 : cards.py 


from random import shuffle 
class Deck: 


， 表示 52 张 扑 克 牌 的 一 副 牌 ， 


= ee 
tS PD ER a i ed 0 ek 


# suits 是 包含 四 个 Unicode 符 号 的 集 ， 表 示 四 种 花色 
Egg = 《Nau2660 。 NI2661 7 ， '\u2662' ， 以 52663 "小 
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本 
”初始 化 52 张 扑 克 牌 的 一 副 牌 ， 
self.deck = [] # deck 最 初 为 空 


for suit in Deck.suits:# suits 和 ranks 是 Deck 类 变量 
for Tank In Deck Tanks: 


# 把 指定 rank 和 suit 的 Card 添加 到 deck 
self.deck.append(Card(rank, suit)) 


def dealCard(self): 
， 从 一 副 牌 的 顶部 发 牌 (弹出 和 返回 ) ， 
return self.deck.pop() 


def shuffle(self): 
1 洗 牌 ' 
shuffle(self .deck) 


修改 类 Deck 的 构造 函数 ， 使 得 该 类 可 以 用 于 非 标准 52 张 扑 克 牌 的 扑 
克 牌 游戏 。 对 于 此 类 游戏 ， 我 们 需要 在 构造 函数 中 显 式 指定 扑克 牌 列表 。 下 面 是 一 些 模拟 
实例 。 

> CC 本] 

>>> deck.shuffle() 

>>> deck.dealCard() 

i, deck.dealCard() 

ri 


8.3.3 ”容器 类 Queue 


队列 是 一 种 容 融 类 型 。 计 算 机 中 的 队列 是 现实 世界 队列 《例如 在 超市 等 竺 结账 的 队列 ) 
的 抽象 。 

在 结账 队列 中 ， 购 物 者 以 先入 先 出 ( FIFO) 的 方式 享用 服务 。 一 个 购物 者 会 自行 排 在 队 
伍 的 最 后 ， 而 队列 中 排 在 第 一 个 的 人 是 下 一 个 至 用 结账 服务 的 人 。 一 般 来 说 ， 所 有 的 插入 必 
须 在 队列 的 后 面 进行 ， 所 有 的 移 除 必须 从 前 面 完 成 。 

我 们 现在 开发 一 个 基本 的 Queue 类 来 抽象 一 个 队列 。 它 将 文 持 对 队列 中 的 项 的 有 限 访 
问 : 方法 enqueue() 把 一 个 项 添加 到 队列 的 尾部 ， 方 法 dequeue() 从 队列 的 头 部 移 除 
一 个 项 。 如 表 8-2 所 示 ，Queue 类 还 支持 方法 isEmpty()， 根据 队列 是 否 为 空 从 而 返回 
True 或 False。Queue 类 被 称 为 FIFO 容 带 类 ， 因 为 移 除 的 项 是 最 早 进 入 队列 的 项 。 

表 8-2 Queue 方法。 队列 是 一 种 包含 一 系列 项 的 容器 。 可 以 通过 方法 enqueue (item) 

和 dequeue() 对 队列 中 的 一 系列 数据 进行 存 取 


池 访 说 有明 
enqueue (item) 把 item 添加 到 队列 的 尾部 
dedqueue( ) 从 队列 的 头 部 移 除 一 个 项 并 返回 该 项 
isEmpty() 如 果 队 列 为 空 ， 则 返回 True， 和 否则 返回 False 


在 实现 Queue 类 之 前 ， 我 们 先 说 明 其 用 法 。 首 先 实例 化 一 个 Queue 对 象 : 


3>> fuit = Quewel) 


然后 插入 一 个 水 来 (作为 一 个 字符 串 ) 到 队列 : 


>>> fruit.enqueue('apple') 


继续 插入 硅 二 水果: 


>>> fruit.enqueue('banana') 
>>> fruit.enqueue('coconut') 


然后 从 队列 中 去 项 : 


>>> fruit.dequeue() 
SPpPle 


方法 dequeue( ) 应 该 从 队列 的 头 部 移 除 一 个 项 并 返回 该 项 。 
继续 执行 dequeue( ) 两 次 后 队列 为 空 


>>> fruit.dequeue() 
‘banana 

>>> fruit.dequeue() 
"TOGonumt 

>>> fruit,isEmpty() 
True 


图 8-6 显示 了 队列 fruit 执行 上 述 命令 后 的 一 系列 状态 。 
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Etud 志 | coconut ' | 


fruit 





二 下 二 | 'coconut | 
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图 8-6 队列 操作 。 其 中 显示 了 一 个 fruit 队列 执行 下 列 语句 后 的 状态 : fruit.enqueue 
('apple')., fruit.enqueue('banana').、 fruit.enqueue('coconut' ).、 


fruit.dequeue().、 fruit.dequeuel() 


8.3.4 实现 oueue 类 


接着 我 们 讨论 Queue 类 的 实现 。 我 们 需要 回答 的 最 重要 的 问题 是 如 何 将 项 存储 在 队列 
中 。 队 列 可 以 是 空 的 ， 也 可 以 包含 无 限 数量 的 项 。 它 还 必须 维护 项 的 顺序 ， 因 为 这 对 于 一 个 
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(公平 的 ) 队列 是 必 不 可 少 的 。 那 么 ， 什 么 样 的 内 置 类 型 可 以 用 来 存储 任意 数量 的 项 ， 而 且 
允许 一 闯 插 入 ， 并 从 夯 一 端 移 除 呢 ? 
列表 类 型 肯定 满足 这 些 约束 ， 所 以 我 们 选择 列表 。 下 一 个 问题 是 : 应 该 在 Queue 类 的 
实现 中 何 时 何 地 创建 此 列表 ? 在 我 们 的 示例 中 ， 很 明显 我 们 期 望 默认 Queue 构造 郧 数 为 我 
们 创建 一 个 空 队 列 。 这 意味 着 一 旦 Queue 对 象 被 创建 后 就 创建 列表 ， 即 在 __ init _() 
方法 中 创建 : 
def __init__(self) : 
:实例 化 一 个 空 列表 ， 用 于 保存 队列 的 项 ， 
self.q = [] 
..。。 并 类 定义 的 其 他 部 分 
接 下 来 我 们 讨论 三 个 Queue 方法 的 实现 。 方 法 isEmpty() 实现 十 分 简单 ， 只 要 检查 
列表 self .9qg 的 长 度 即 可 : 
def isEmpty(self) : 
”如 果 队 列 为 窗 ， 则 返回 True， 和 否则 返回 False ' 
return (len(self.q) == 0) 
方法 enqueue( ) 应 该 把 项 添加 到 队列 self.q 的 尾部 ， 而 方法 dequeue() 则 应 该 
从 队列 self .9q 的 头 部 移 除 项 。 我 们 需要 确定 什么 是 队列 self.q 的 头 部 。 我 们 可 以 选择 
最 左 侧 列表 元 素 ( 即 索引 0 ) 或 最 右 侧 元 素 (索引 -1 ) 作为 列表 的 头 部 。 两 者 都 可 以 ， 其 优 
缺点 取决 于 内 置 类 list 的 底层 实现 (这 超出 了 本 章 讨 论 的 范围 )。 
在 图 8-6 中 ， 队 列 的 第 一 个 元 素 显示 在 左 侧 ， 我 们 关联 为 索引 0， 因 此 我 们 的 实现 采用 
了 同样 的 方法 。 一 旦 做 出 了 决策 ，Queue 类 可 以 实现 如 下 : 


模块 : ch8.py 


class Queue: 
， 一 个 典型 的 队列 类 ， 


def init (self): 


， 实例 化 一 个 空 列表 ， 
self.q = [] 


def isEmpty(self) : 
”如果 队 列 为 空 ， 则 返回 True， 和 否则 返回 False ， 
return (len(self.q) == 0) 


def enqueue (self, item): 
， 插入 一 个 项 到 队列 尾部 ， 
return self.q.append(item) 
def dequeue(self): 


， 从 队列 头 部 移 除 一 个 项 并 返回 该 项 ， 
return self.q.pop(0) 


8.4 运算 符 重 载 
迄今 为 止 ， 我 们 开发 的 用 户 自 定义 类 存在 一 些 不 便 之 处 。 例 如 ， 假 设 创建 了 一 个 点 对 象 : 


>>> point = Point(3,5) 
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然后 尝试 对 其 求 值 : 
>>> point 
<__main__.Point object at Oxil5e5410> 


不 是 很 方便 ， 对 吧 ? 顺便 说 一 下 ， 结 果 显 示 point 指向 的 是 一 个 Point 类 型 的 对 象 ， 其 中 
Point 定义 在 顶层 模块 的 命名 空间 中 ， 其 对 象 ID (实际 上 是 内 存 地 址 ) 为 0x15e5410 (十 六 
进 制 )。 在 大 多 数 情 况 下 ， 这 可 能 不 是 我 们 对 point 求 值 时 希望 得 到 的 信息 。 

还 存在 另 一 个 问题 。 要 获得 一 个 字符 串 的 字符 个 数 ， 或 一 个 列表 、 字 典 、 元 组 ， 或 集合 
中 的 项 的 个 数 ， 我 们 可 以 使 用 len( ) 函数 。 很 自然 我 们 和 希望 使 用 相同 的 函数 获取 Ooueue 容 
需 对 象 中 的 项 的 个 数 。 不 幸 的 是 ， 结 果 没 有 得 到 : 


>>> fruit = Queue() 

>>> fruit.enqueue('apple') 

>>> fruit.enqueue('banana ' ) 

>>> fruit.enqueue('coconut') 

>>> len(fruit) 

TracebacKk (most recent call last): 

File "<pyshell#356>", line 1, in <module> 

len(fruit) 

TypeError: object of type 'Queue' has no len() 


我 们 想 说 明 的 是 : 我 们 迄今 开发 的 类 没有 内 置 类 的 行为 。 为 了 使 得 用 户 自 定义 的 类 有 用 
且 易 于 使 用 ， 让 它们 更 为 用 户 熟 悉 〈 即 更 像 内 置 类 ) 是 十 分 重要 的 。 幸 运 的 是 ，Python 支持 
运算 符 重 载 ， 从 而 使 其 成 为 可 能 。 


8.4.1 运算 符 是 类 方法 
考虑 运算 符 +。 它 可 以 用 于 两 个 数值 相 加 : 


>>》3 2 村 去 
6 


也 可 以 用 于 拼接 列表 或 字符 串 : 


Do [5 0 二 [于 
[4 5 6 7] 
> "tN 


string' 

+ 运算 和 从 被 称 为 重 载运 算 符 。 重 载运 算 符 是 一 个 为 多 个 类 定义 的 运算 符 。 对 于 每 一 个 
类 ， 运 算 符 的 定义 和 意义 都 是 不 同 的 。 例 如 ， 对 于 int、1ist 和 str 类， 都 定义 了 + 操作 
符 。 对 于 int 类 ， 它 实现 整数 相 加 运算 ; 对 于 1ist 类 ， 它 实现 列表 拼接 运算 ; 对 于 str 
类 ， 它 实现 字符 串 拼 接 运算 。 现 在 的 问题 是 : 如 何 为 特定 类 定义 运算 符 +? 

Python 是 一 种 面向 对 象 的 语言 ， 正 如 我 们 所 说 ， 任 何 “ 求 值 ”， 包 括 对 算术 表达 式 (如 
2+4 ) 的 求 仁 ， 实 际 上 是 一 种 方法 调用 。 要 确定 究竟 调用 了 什么 方法 ， 需 要 使 用 help() 文 
档 工 具 。 无 论 输 入 help(int)、help(str) 或 help(1ist)， 都 会 看 到 + 运算 符 的 如 下 
文档 : 


口 


add Xs z 
| x.__add__(y) <==> x+y 
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这 意味 着 当 Python 表达 式 x+y 求 值 时 ， 它 首先 把 表达 式 替 换 为 x. add (y)， 即 
对 象 x 的 方法 调用 (y 作为 输入 参数 )， 然 后 对 新 的 表达 式 (方法 调用 ) 求 值 。 不管 x 和 Yy 是 
什么 , 求 值 过 程 都 是 这 样 的 。 因 此 ， 对 表达 式 2+3、[4,5,6]+[7] 和 'strin'+'g' 的 
求 值 ， 实 际 上 可 以 使 用 如 下 方法 调用 _adqd _( ) 来 代替 : 


> Et2 dd 04) 

6 

5335 [4, 5, 6] ,add [7]) 
[> 
区 


‘string 


知识 拓展 : 归根 结 底 ， 加 法 只 是 一 个 函数 
Python 解释 器 把 代数 表达 式 : 


>>> x+y 

翻译 成 方法 调用 : 

>>> x.__add__(y) 

在 第 7 章 ， 我 们 学 习 到 解释 器 把 该 方法 调用 翻译 成 : 
>>> type(tx}.. add__(x,y) 


(请 回忆 ，type(x) 的 求 值 结果 为 对 象 x 的 类 。) 最 后 一 个 表达 式 是 实际 求 值 的 表达 式 。 


当然 ， 所 有 的 运算 符 都 是 如 此 : 任何 表达 式 或 方法 调用 实际 上 是 调用 第 一 个 操作 数 所 
在 的 类 的 名 称 空间 中 定义 的 一 个 函数 。 


+ 运算 符 仅仅 是 Python 重 载运 算 符 之 一 ， 表 8-3 显示 了 其 他 一 些 重 载运 算 符 。 对 于 每 个 
运算 符 ， 显 示 了 其 对 应 的 孔 数 ， 及 其 针对 数值 类 型 、1ist 类 型 和 str 类 型 的 运算 行为 的 解 
释 说 明 。 所 有 列举 的 运算 符 同样 在 其 他 内 置 类 型 (dict、set 等 ) 中 定义 ， 也 可 以 在 用 户 
自 定义 类 型 中 定义 (如 下 文 所 示 )。 

注意 ， 表 8-3 列举 的 最 后 一 个 运算 符 是 重 载 构造 函数 运算 符 ， 对 应 于 函数 init  ()。 
我 们 已 经 讨论 了 在 一 个 用 户 自 定义 类 中 如 何 实现 一 个 重 载 构造 函数 。 我 们 将 看 到 实现 其 他 重 
载运 算 符 的 方法 都 十 分 类 似 。 

表 8-3” 重 载运 算 符 。 其 中 列 出 了 一 些 常用 的 重 载 运算 符 ， 以 及 对 应 的 方法 和 针对 数值 、 列 

表 和 字符 的 运算 行为 
列表 和 字符 串 
拼接 


日 拼接 


等 于 
不 等 于 








( 续 ) 
运算 符 数值 列表 和 字符 串 
xX>y 类 十 
x>=y 大 于 或 等 于 
X<Y 小 于 
x<=y 小 于 或 等 于 
repr (x) 规范 的 字符 串 表示 形式 
str (x) 非 正 式 的 字符 串 表示 形式 
len(x) 集合 大 小 
<type>(x) <type>。 init (x) 构造 师 数 


8.4.2 使 Point 类 对 用 户 友 好 
先 回 顾 一 下 之 前 我 们 所 使 用 的 如 下 示例 : 


>>> point = Point(3,5) 
>>> point 
<__main__.Point object at Oxi5e5410> 


假设 我 们 更 期 望 point 的 求 值 结果 如 下 所 示 : 


>>> point 
Point(3, 5) 


为 了 理解 我 们 如 何 做 到 这 一 点 ， 首 先 需要 理解 ， 当 在 命令 行 中 对 point 求 值 时 ， 
Python 将 显示 对 象 的 字符 串 表 示 形 式 。 对 象 的 默认 字符 串 表 示 形 式 是 它 的 类 型 和 地 址 ， 如 
下 所 示 : 

<__main__.Point object at 0OxXxl5e5410> 


要 修改 一 个 类 的 字符 串 表 示 形 式 ， 我 们 需要 为 该 类 实现 重 载 运算 付 repr ( ) 。 当 对 和 象 需 
要 表示 为 一 个 字符 串 时 ， 解 释 需 目 动 调用 运算 符 repr( )。 在 解释 需 命 令 行 中 需要 显示 一 个 
对 象 时 ， 就 是 这 种 情况 。 因 此 包含 数值 3、4 和 5 的 列表 1st 的 友好 表示 为 [3，4，51]: 


>>> lst 
[35 45 8] 


实际 上 显示 的 是 调用 repr (1st) 的 字符 串 输出 : 


>>> repr (lst) 
本。 


基于 上 述 目 的 ,所 有 的 内 置 类 都 实现 了 重 载运 算 符 zepr()。 要 修改 用 户 目 定义 类 
的 对 象 的 默认 字符 串 表 示 形 式 ， 我 们 需要 同样 操作 。 我 们 通过 实现 表 8-3 中 对 应 于 运算 符 
repr() 的 方法 : 方法 ”repr _()。 

要 使 得 一 个 Point 对 象 的 显示 格式 为 Point(<x>， <y>)， 我 们 需要 做 的 是 添加 如 下 
方法 到 类 Point 中 : 


模块 : ch8.py 


class Point: 


# 其 他 Point 方法 
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def __repr__(self): 


' 竣 回 疯 范 学 得 申 玫 形式 point (x i 
return 'Point ({}, {})'.format(self.x, self.y) 


现在 ， 让 我 们 在 命令 行 中 对 一 个 Point 对 象 求 值 ， 结 果 的 确 符 合 预 期 : 


>>> point = Point(3,5) 
>>> point 
Point (3, 5) 


注意 事项 : 对 象 的 字符 串 表 示 形 式 

实际 上 有 两 种 方式 来 获取 对 象 的 字符 串 表 示 形 式 : 重 载 运算 符 repr() 和 字符 串 的 
构造 函数 str( )。 

运算 符 zepr() 用 于 返回 对 象 的 规范 字符 串 表 示 形 式 。 理 想 情况 下 (不 是 必然 )， 这 
就 是 用 来 构造 对 象 的 字符 串 表 示 形 式 , 例如 '[2，3，4]' 或 者 'Point(3,，5)'。 

换言之 ,表达 式 eval (repr(o)) 的 求 值 结果 应 该 返回 对 象 原来 的 o。 在 解释 器 命 
令 行 中 当 一 个 表达 式 的 求 值 结果 为 一 个 对 象 并 且 需 要 在 命令 行 窗口 中 显示 该 对 象 时 ， 会 自 
动 调用 方法 repr()。 

字符 串 构造 函数 str( ) 返回 对 象 的 非 正 式 且 非常 易于 阅读 的 字符 串 表 示 形 式 。 该 字 
符 串 表示 形式 通过 调用 方法 o。 str  () 获得 (如 果实 现 了 str _() 敌 放 | 当 
使 用 函数 print() 来 “美化 输出 ”对 象 时 ，Python 解释 器 调用 字符 串 构 造 函 数 来 代替 重 
载运 算 符 zepr()。 我 们 以 下 述 类 为 例 说 明 : 

class Representation: 


def __repr__(self) : 


rotiirn ' 规范 字符 串 表示 形式 。' 
def __str__(self) : 


i 
测试 结果 如 下 ， 


>>> rep = Representation() 
>>> rep 


规范 字符 串 表 示 形 式 。 
>>> print(rep) 


美化 的 字符 串 表 示 形 式 。 


8.4.3 构造 函数 和 repr() 运算 符 之 间 的 约定 


述 注意 事项 表明 ， 重 载运 算 符 repz() 的 输出 应 该 是 对 象 的 规范 字符 串 表 示 形 式 。 
Point 各 Point(3，5) 的 规范 字符 串 表 示 形 式 是 'Point (3，5)'。 同 样 Point 对 象 
的 repr( ) 运算 和 从 的 输出 结果 为 : 


>>> eed ri 5)) 


结果 好 像 满 足 构 造 消 数 和 表示 运算 符 repr( ) 之 间 的 约定 : 它们 相同 。 验 证 如 下 : 


>>> Point(3, 5) == eval(repr (Point (3, 5))) 
False 


什么 地 方 出 错 了 ? 


问题 与 构造 商 数 或 运算 符 repr ( ) 无 关 ， 而 是 与 运算 符 == 有 关 : 它 并 不 认为 两 个 具有 
相同 坐标 值 的 点 一 定 相 等 。 验 证 如 下 : 


>>> Point(3, 5) == Point (3, 5) 
False 


这 种 奇怪 行为 的 原因 是 ， 对 于 用 户 自 定义 的 类 ， 操 作 符 == 的 默认 行为 是 只 有 当 我 们 比 
较 的 两 个 对 象 是 同一 个 对 象 时 才 返 回 True。 让 这 个 事实 : 


>>> point = Point(3,5) 
>>> point == point 
True 


正如 表 8-3 所 示 ， 对 应 于 重 载 运算 符 == 的 方法 是 ”_eq _( )。 要 改变 重 载 运算 符 == 的 行 
为 ， 我 们 需要 在 类 Point 中 实现 方法 ”eq  ()。 我 们 在 类 Point 的 最 终 版 本 实现 了 该 方法 : 


模块 : ch8.py 


class Point: 


， 表示 平面 上 点 的 类 ， 


def __init__(self，xcoord=0，ycoord=0) : 
， 初始 化 点 坐标 为 (xcoord ，YyYcoord) ， 
self.x = xcoord 
self.y = ycoord 
def setx(self, xcoord).: 
' 把 点 的 x 坐标 设置 为 xcoord ' 
self .x = xcoord 
def sety(self, ycoord): 
， 把 点 的 y 坐标 设置 为 ycoord ， 
self.y = ycoord 
def get(self) : 
返回 点 的 Xx 坐标 和 yy 坐标 ， 结 果 为 元 组 ， 
return (self.x, self.y) 
def move(self, dx, dy): 
' 根据 dx 和 dy 的 值 分 别 修改 x 坐标 和 yy 坐标 ， 
self.x += dx 
self.y += dy 
def __eq__(self, other): 
'， 如 果 坐 标 相 同 ，se1lf == other 返回 True ' 
return self.x == other.x and self.y == other.y 
def __repr__(self) : 
' 返回 规范 化 字符 串 表 示 形 式 Point (x ，Y) ， 
return 'Poitnt(t，{) Tornat(self ,X，B6lLt .7) 


类 Point 的 新 实现 还 文 持 == 运算 符 ， 使 得 其 运算 符合 预期 的 意义 : 


>>> Point(3，5) == Point(3，5) 
True 


同时 ， 类 Point 的 新 实现 也 满足 构造 限 数 和 运算 符 repr( ) 之 间 的 约定 
>>> Point(3, 5) == eval(repr (Point (3, 5))) 


True 


在 Card 类 中 实现 重 载运 算 符 repr() 和 ==。 新 的 Card 类 的 运行 结果 
Mey 
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>>> Card('3'，' 击 ') == Card('3'，' 命 ') 

True 

>>> Card('3'，' 仗 ') == eval(repr(Card('3'，' 仗 '))) 
True 


8.4.4 使 oueue 类 对 用 户 友 好 


接 下 来 我 们 通过 重 载运 算 符 zepr()、== 和 1en()， 使 得 上 一 节 的 类 oueue 更 加 友 
好 。 在 开发 过 程 中 我 们 发 现 扩 展 构造 旺 数 有 帮助 。 
我 们 从 如 下 oueue 的 实现 开始 : 


模块 : ch8.py 


class Queue: 
， 一 个 典型 的 队列 类 ， 


daef init (self): 


， 自 例 化 一 沾 室 列表 ， 
self.q = [] 


def isEmpty(self): 
' 如 果 队 列 为 空 ， 则 返回 True， 否 则 返回 False ， 
return (len(self.q) == 0) 


def enqueue (self, item): 
， 插入 一 个 项 到 队列 尾部 ， 
return self.q.append(item) 


def dequeue(self) : 
， 从 队列 头 部 移 除 一 个 项 并 返回 该 项 ， 
return Self.q.pop(0O) 


让 我 们 首先 处 理 “ 人 简单 的 ”运算 符 。 两 个 队列 相等 意味 着 什么 ”意味 着 两 个 队列 包含 相 
同 的 元 素 且 顺序 相同 。 换 言 之 ， 两 个 队列 包含 的 列表 相同 。 因 此 ， 类 gueue 的 运算 符 
eq__() 的 实现 应 该 包括 我 们 比较 的 两 个 Queue 对 象 对 应 的 两 个 列表 之 间 的 比较 : 
def __eq__(self, other): 
' 如 果 队 列 self 和 other 包含 相同 项 
且 顺 序 相同 ， 则 返回 True ''' 
return self.q == other.q 
重 载运 算 符 len() 返回 容 需 中 的 项 目的 个 数 。 要 在 oueue 对 象 上 使 用 len() 也 数 ， 
必须 在 Queue 类 中 实现 对 应 的 方法 。 len “() (参见 表 8-3 ) 。 很 显然 ， 队 列 的 长 度 是 底 
层 列 表 self .gq 的 长 度 : 
def __len__(self): 
， 返回 队列 中 项 的 个 数 ， 
return len(self .gq) 
接着 让 我 们 解决 repr ( ) 运算 符 的 实现 。 假 设 按 如 下 方式 构建 队列 : 


>>> fruit = Queue() 

>>> fruit.enqueue('apple') 
>>> fruit.enqueue('banana') 
>>> fruit .enqueue('coconut ') 
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那么 我 们 希望 规范 字符 串 表示 形式 是 什么 样子 呢 ? 请 问 如 下 形式 如 何 : 


>>> fruit 
Queue(['apple'， 'banana', coconut ']) 


如 前 所 述 ， 要 实现 重 载 运算 符 repr ( )， 理想 情 况 是 满足 其 与 构造 孙 数 之 间 的 约定 。 要 
满足 约定 ， 则 必须 能 够 按照 如 下 形式 构建 队列 : 


>>> Queue(['appla', 'banana', "THeant’ }) 
Traceback (most recent call last): 


File "<pyshell#404>", line 1, in <module> 
Queue(['apple', 'banana', 'coconut']) 
TypeError: __init__() takes exactly 1 positional argument (2 given) 


结果 出 错 啦 ! 因为 Queue 构造 郴 数 实现 为 不 市 任何 输入 参数 ， 所 以 ， 我 们 决定 修改 构造 冰 
数 。 这 样 做 的 优点 有 二 : (1 ) 满足 构造 孙 数 和 repz() 之 间 的 约定 ; (2 ) 新 建 的 Queue 对 
象 在 实例 化 的 时 候 可 以 初始 化 。 


模块 : ch8.py 


class Queue: 


， 一 个 典型 的 队列 类 ， 


def __init__(self，q=None) : 
' 根据 列表 q 初始 化 队列 ， 默 认为 空 队 列 。， 


if q == None : 
self.q = [] 

else: 
self.q=q 


1 # 此 处 定义 方法 enqueue、dequeue 和 isEmpty 


def __eq__(self, other): 


''， 如 果 队 列 self 和 other 包含 相同 项 


且 顺 序 相同 ， 则 返回 Tue *:) 
return Selt,q == other.q 


def __len__(self): 
' 返回 队列 中 项 的 个 数 ， 
return len(self.gq) 


def __repr__(self) : 


' 返回 队列 的 规范 字符 串 表 示 形 式 ， 
return 'Queue ({}+) ' .format(self.q) 





在 Deck 类 中 实现 重 载运 算 符 len()、repr() 和 ==。 新 的 Deck 类 的 
运行 结果 如 下 所 示 : 


>>> len(Deck())) 


52 

>>> Deck() == Deck() 

True 

>>> Deck() == eval (repr (Deck())) 


True 
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8.5 继承 


代码 重用 是 软件 工程 的 一 个 基本 目标 。 将 代码 封装 为 函数 的 主要 原因 之 一 是 代码 更 容易 
重用 。 类 似 地 ， 将 代码 组 织 到 用 户 自 定义 类 中 的 一 个 主要 好 处 是 ， 类 可 以 在 其 他 程序 中 重 
用 ， 束 像 在 开发 另 一 个 程序 时 使 用 困 数 一 样 。 一 个 类 可 以 被 重复 使 用 ， 正 如 我 们 从 第 2 章 以 
来 一 直 在 做 的 一 样 。 一 个 类 也 可 以 通过 类 继承 被 扩展 到 一 个 新 类 中 。 在 这 一 节 中 ， 我 们 将 介 
绍 第 二 种 方法 。 


8.5.1 继承 类 的 属性 


假设 在 开发 应 用 程序 的 过 程 中 ， 我 们 发 现 如 果 有 一 个 类 的 使 用 完全 类 似 于 内 置 的 类 
1ist， 且 支持 一 种 称 为 choice() 的 方法 ， 可 以 随机 从 列表 中 选择 并 返回 一 个 项 将 大 大 方 
便 我 们 的 使 用 。 

更 准确 地 说 ， 这 个 类 (我 们 称 之 为 MyList) 将 以 同样 的 方式 支持 类 1ist 同样 的 方法 。 
例如 ， 我 们 可 以 创建 一 个 MyList 容 需 对 象 : 


>>> mylst = MyList() 


我 们 还 可 以 使 用 1ist 的 append( ) 方法 添加 项 ， 使 用 重 载 运算 符 len( ) 计算 项 目 个 
数 ， 使 用 列表 方法 count ( ) 统计 一 个 项 出 现 的 次 数 : 


>>> mylst.append(2) 
>>> mylst .append(3) 
>>> mylst .append(5) 
>>> mylst .append(3) 
>>> len(mylst) 

>>> mylst.count (3) 
2 


除了 支持 类 1ist 支持 的 相同 方法 之 外 ， 类 MyList 还 支持 方法 choice()， 从 列表 
中 返回 一 个 项 ， 列 表 中 的 每 个 项 被 选中 的 概率 相同 : 


>>> mylst.choice() 
5 
>>> mylst.choice() 
2 
>>> mylst.choice() 
5 


实现 类 MyList 的 一 种 方法 是 我 们 开发 类 Deck 和 Queue 的 方法 。 使 用 一 个 实例 变量 
self .1st 来 存储 MyList 的 项 : 


import random 
class MyList: 
def __init__(self, initial = []): 
self.lst = initial 
def __len__(self): 
return len(self.l1st) 
def append(self ，item) : 
self.lst.append(self, item) 
# 其 他 “1ist” 方 法 的 实现 


def choice(self): 
return random.choice(self.1st) 
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使 用 这 种 方法 开发 类 MyList 要 求 我 们 编写 30 个 以 上 的 方法 。 这 需要 花费 时 间 ， 而 且 
很 乏味 。 有 没有 更 好 的 方法 呢 ? 本 质 上 ， 类 MyList 是 类 1ist 的 一 种 “扩展 ”， 增 加 了 一 
个 额外 的 方法 choice( )。 结 果 表 明 我 们 可 以 采用 如 下 方式 来 实现 : 


模块 : ch8.py 


import random 
class MyList (list): 
， 1ist 的 一 个 子 类 ， 实 现 了 方法 choice ， 


def choicet(tself): 
' 返回 从 1ist 中 随机 选择 的 项 ， 
return random.choice(self) 


上 例 类 的 定义 指明 类 MyList 是 类 1ist 的 子 类 ， 因 此 支持 类 1ist 支持 的 所 有 方法 。 
这 在 第 一 行 中 说 明 


class MyList(list): 


类 1ist 和 MyList 之 间 的 层次 结构 如 图 8-7 所 示 。 


init append len _.. ount 
类 list 
choice 
mylst 类 MyList 







__main _ 名 称 空 间 


图 8-7 类 1ist 和 MyList 的 层次 结构 。 其 中 列举 了 类 1ist 的 一 些 属性 ， 分 别 指向 相应 的 
图 数 。 类 MyList 是 类 1ist 的 子 类 ,继承 类 1ist 的 所 有 属性 。 类 MyList 还 定义 
了 一 个 额外 的 属性 : 方法 choice()。my1lst 指 加 的 对 象 继承 了 其 类 MyList 的 所 有 
属性 ， 其 中 包括 类 1ist 的 属性 





图 8-7 显示 了 在 解释 需 命 令 行 ( 即 在 ”main _ 名 称 空间 ) 中 创建 的 一 个 称 为 mylst 
的 MyList 容 髓 对 和 象 : 


:> 25) 


对 和 象 mylst 显示 为 类 MyList 的 一 个 “孩子 ”。 图 中 层次 结构 说 明 对 象 mylst 继承 类 
MyList 的 所 有 属性 。 在 8.1 节 ， 我 们 了 解 到 对 象 继 承 其 类 的 属性 。 

图 8-7 同时 显示 MyList 是 类 1ist 的 一 个 “孩子 ” 。 图 中 层次 结构 表明 MyList 继承 
类 1ist 的 所 有 属性 。 读 者 可 以 使 用 内 置 函数 dir( ) 来 验证 : 

>>> dir(MyList) 


[六 
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ead aa “GOLCe “ECOUEt s "Stend > Te IESeI 5 
1 pop : 。 'remove', "reverse', 'sort']| 
这 意味 着 对 象 mylst 将 从 类 MyList 中 继承 方法 choice()， 同 时 还 会 继承 List 的 
所 有 属性 。 同 样 可 以 验证 如 下 : 
>>> dir(mylst) 


ba "ata ss,. “ CO ddlatte "s 


二 Pen 。 “choice” ; “count', "extend ss "index' , "insert'; 


"PoP ， ‘remove', 'reverse', te] 


类 MyList 被 称 为 类 1ist 的 一 个 子 类 。 类 1ist 是 类 MyList 的 父 类 。 


8.5.2 ”类 定义 的 一 般 格式 

当 我 们 实现 类 Point、Animal、Card、Deck 和 Queue 时 ， 我 们 使 用 下 列 格式 作为 
类 定义 语句 的 第 一 行 : 

class < 类 名 >; 

要 定义 继承 一 个 既 存 类 < 父 类 > 的 属性 的 类 ， 类 定义 语句 的 第 一 行 应 该 为 : 

class < 类 名 >(< 父 类 名 >): 

还 可 以 定义 继承 多 个 既 存 类 的 属性 的 类 。 在 这 种 情况 下 ， 类 定义 语句 的 第 一 行为 : 


class < 类 名 >(< 父 类 名 1>，< 父 类 名 2> 2) 


8.5.3 重 写 父 类 方法 
我 们 使 用 另 一 个 简单 示例 描述 继承 。 假 如 我 们 需要 一 个 与 8.1 节 中 类 Animal 类 似 的 类 
Bird。 类 Bird 和 类 Animal 一 样 ， 文 持 方法 setSpecies() 和 setLanguage( ) : 


>>> tweety = Bird() 
>>> tweety.setSpecies('canary') 
>>> tweety.setLanguage('tweet ') 


类 Bird 同样 支持 名 为 speak( ) 的 方法 。 然 而 ， 其 行为 与 Rnimal 方法 speak() 不 同 : 


>>> tweety .speak() 
tweet! tweet! tweet! 


下 面 是 我 们 期 望 的 类 Bird 的 行为 的 为 一 个 示例 : 


>>> daffy = Bird() 

>>> daffy.setSpecies('duck') 
>>> daffy.setLanguage('quack ') 
>>> daffy.speak() 

quack! quack! quack! 


接 下 来 我 们 讨论 如 何 实 现 类 Bird。 因 为 Bird 共享 既 存 类 Animal 的 属性 (毕竟 乌 类 也 
是 动物 )， 我 们 把 它 开发 成 Animal 的 一 个 子 类 。 让 我 们 首先 回顾 8.1 节 中 类 Animal 的 定义 : 


模块 : ch8.py 


class Animal : 


， 表示 一 个 动物 ， 
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def setSpecies(self, species): 
， 设置 动物 的 种 类 ， 


self.spec = Species 
8 def setLanguage(self, language).: 
”设置 动物 的 语言 ， 
self.lang = language 
def speak(self) : 
”输出 动物 的 信息 ， 
print('I am a {} and I {+.'.format(self.spec，self.1ang)) 


如 果 把 类 Bird 定义 为 类 Animal 的 一 个 子 类 ， 则 其 方法 speak( ) 的 行为 将 不 相符 。 
所 以 问题 是 : 有 没有 一 种 方法 来 定义 Bird 为 Animal 的 一 个 子 类 ， 同 时 在 类 Bird 中 改变 
方法 speak ( ) 的 行为 ? 

当然 ， 只 需要 在 类 Bird 中 简单 地 实现 一 个 新 的 方法 speak( ) 即 可 : 


模块 : ch8.py 
class Bird(Animal) : 
一品 号 
4 def speak(self).: 
5 ”输出 乌 的 声音 ， 
6 print('{}! '.format(self.language) * 3) 


类 Bird 被 定义 为 Animal 的 一 个 子 类 。 因 此 ， 它 继承 类 Animal 的 所 有 属性 ， 包 括 
Rnimal 方法 speak()。 但 是 ,在 类 Bird 中 存在 一 个 方法 speak( ) ， 这 个 方法 替代 继承 
的 Animal 方法 speak()。 我 们 称 之 为 Bird 方法 重 写 了 父 类 方法 speak( ) 。 

现在 ， 当 在 一 个 Bird 对 象 上 (例如 daffy) 调用 方法 speak() 时 ，Python 解释 硕 如 
何 确定 调用 哪个 speak( ) 方法 呢 ? 我 们 使 用 图 8-8 来 说 明 Python 解释 器 如 何 查找 属性 定义 。 


setSpecies SetLanguage speak 
类 Animal 
speak 
daffy 类 Bird 
__main _ 名 称 空间 
spec lang 
对 象 daffy 
图 8-8 与 类 Animal 和 Bird、 对 象 daffy、 命 令 行 关联 的 名 称 空间 。 省 略 了 实例 变量 的 值 


和 类 方法 的 实现 
当 解 释 硕 执行 如 下 语句 : 
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>>> daffy = Bird() 


解释 器 创建 一 个 名 为 daffy 的 Bird 对 象 和 一 个 相关 联 的 名 称 空间 (初始 为 空 ) 。 接 下 
来 让 我 们 考虑 Python 解释 器 如 何 查 找 下 列 语句 中 的 setSpecies() 的 定义 : 


>>> daffy.setSpecies('duck') 


解释 化 从 与 对 象 daffy 关联 的 名 称 空 间 开 始 沿 着 类 层次 结构 查找 属性 setSpecies( ) 
的 定义 。 解 释 融 在 与 对 象 daffy 关联 的 名 称 空 间 和 与 类 Bird 关联 的 名 称 空间 中 都 没有 查 
找到 其 定义 。 最 终 ， 在 类 Animal 关联 的 名 称 空间 中 查找 到 了 setSpecies( ) 的 定义 。 

解释 带 对 下 列表 达 式 求 值 时 查找 方法 定义 ， 最 终 也 是 在 类 Animal 的 名 称 空间 中 找到 : 


>>> daffy.setLanguage('quack ') 


然而 ， 当 Python 解释 硕 执 行 如 下 语句 : 

>>> daffy .speak() 

quack! quack! quack! 

解释 器 在 类 Bird 中 查找 到 方法 speak( ) 的 定义 。 换 言 之 ， 查 找 属 性 speak 永远 不 
会 到 达 类 Anima1l。 最 后 执行 的 是 Bird 的 speak() 方法 。 


注意 事项 : 关于 属性 名 称 问 题 
现在 我 们 理解 了 Python 解释 器 如 何 对 对 象 属 性 求 值 ， 接 下 来 我 们 讨论 由 于 粗心 大 意 
选择 属性 名 称 可 能 导致 的 问题 。 例如， 对 于 下 列 类 定义 : 
class Problem: 


def value(self, v): 
self.value = V 


>>> p = Problem() 
>>> p.value(9) 
>>> p.value 

9 


一 切 看 起 还 不 错 。 当 执行 p.value(9) 时， 对象 p 并 没有 实例 变量 value,， 属 
性 搜索 结果 为 类 Problem 中 的 函数 value()。 随 后 在 对 象 自 身 中 创建 一 个 实例 变量 
value， 通 过 对 后 面 的 语句 (p.value) 求 值 证 明了 这 一 点 。 
接着 让 我 们 尝试 : 
>>> p.value(3) 
Traceback (most recent call last): 
File "<pyshell#324>", line 1, in <module> 


p.value(9) 
TypeError: 'int' object is not callable 


哪儿 出 错 了 ? 查找 属性 value 从 对 象 p 开始 到 对 象 p 结束 : 对 象 有 一 个 名 为 value 
的 属性 。 该 属性 指向 一 个 整 型 对 象 (也 就 是 9 )， 该 整 型 对 象 是 不 能 作为 函数 被 调用 的 。 
8.5.4 扩展 父 类 方法 
我 们 已 经 讨论 了 一 个 子 类 可 以 从 父 类 继承 一 个 方法 并 重 写 该 方法 。 还 可 以 扩展 一 个 父 类 


.A 
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方法 。 我 们 使 用 一 个 对 三 种 继承 模式 进行 比较 的 例子 来 说 明 这 一 点 。 
当 将 类 设计 为 另 一 个 类 的 子 类 时 ， 继 承 的 属性 以 几 种 方式 处 理 : 继承 、 蔡 换 、 扩 展 。 下 
一 个 模块 显示 Super 类 的 三 个 子 类 。 每 一 个 子 类 对 继承 属性 的 三 种 处 理 方 式 之 一 进行 说 明 。 


模块 : ch8.py 


class Super: 
下 甫 用 类 所 党 一 个 者 法 ， 
def method(self): # Super 方法 
print('in Super.method') 


class Inheritor(Super): 
' 继承 方法 的 子 类 ， 


pass 


class Replacer (Super): 
” 重 写 方法 的 子 类 ， 
def method(self) : 
13 print(*dn Replacer .method') 


class Extender (Super) : 
， 扩展 方法 的 子 类 ， 
def method(self): 
print('starting Extender .method ' ) 
Super .method(self)# 调用 父 类 方法 
print('ending Extender .method ' ) 


在 类 Inheritor 中 ， 原 封 不 动 地 继承 了 属性 method( )。 在 类 Replacer 中 ， 完 
全 重 写 了 方法 。 在 类 Extender 中 ， 属 性 method() 被 重 写 ， 但 在 类 了 Extendez 的 
method( ) 的 实现 中 调用 了 类 super 的 原始 method( ) 方法 。 结 果 类 Extendezr 回 父 类 
属性 添加 了 额外 的 行为 。 

在 大 多 数 情 况 下 ， 子 类 将 以 不 同方 式 继 承 不 同 的 属性 ， 但 每 个 继承 属性 将 遵循 上 述 三 种 
模式 的 一 种 。 

实现 一 个 类 Vector， 支 持 我 们 在 8.4 节 中 开发 的 类 Point 的 同样 方法 。 
类 Vector 还 应 该 支持 向 量 加 法 和 来 法 操作 。 对 于 如 下 的 两 个 向 量 : 


33% yi < Vectort1l, 3) 
> V2 = Voctort-2, 4 


其 加 法 结果 是 一 个 新 向 量 ， 其 坐标 是 V1 和 V2 对 应 坐标 之 和 : 


> > 
Vector(-1, 7) 


向 量 V1 和 V2 的 乘法 是 对 应 坐标 乘法 之 和 : 
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为 了 使 得 一 个 Vector 对 象 显 示 为 Vector( 。， 。) 而 不 是 Point(。，。)， 需 要 重 写 
方法 TepbY 《ws 
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8.5.5 ”通过 继承 List 实现 一 个 Queue 类 


我 们 在 第 8.3 和 8.4 节 开 发 的 类 oueue 仅仅 是 设计 和 实现 一 个 队列 类 的 方法 之 一 。 现 在 
我 们 认识 到 每 个 Queue 对 象 仅仅 是 一 个 队列 对 象 的 “ 轻 封 活 ”"， 男 一 种 实现 方法 就 显而易见 
了 。 为 什么 不 设计 oueue 类 使 得 每 个 Queue 对 象 是 一 个 List 对 象 呢 ? 换言之 ， 为 什么 不 
设计 Queue 类 作为 list 的 一 个 子 类 呢 ? 让 我 们 马上 来 实现 吧 。 


模块 : ch8.py 


class Queue2(1ist) : 
， 一 个 队列 类 ，1ist 的 子 类 ， 


def isEmpty(self): 
: 如 果 队 列 为 空 则 逝 回 True， 否 则 返回 False ' 
return (len(self) == 0) 


def dequeue(self) : 
， 从 队列 的 头 部 移 除 并 返回 一 个 项 ， 
return self.pop(0O) 


def enqueue (self, item): 


， 插入 一 个 项 到 队列 的 尾部 ， 


return self .append(item) 


注意 ， 因 为 变量 self 指向 一 个 Queue2 对 象 ( List 的 一 个 子 类 )， 随 之 self 同样 是 
一 个 list 对象。 因此 在 self 上 可 以 直接 调用 1ist 方 法 (如 pop() 和 append())。 同 
样 请 注意 , 方法 repr _() 和 len _() 不 需要 实现 ， 因 为 它们 从 List 父 类 继承 。 

开发 类 gueue2 的 工作 量 比 开发 原始 的 Queue 类 少 很 多 。 感 觉 是 不 是 更 棒 ? 


注意 事项 : 过 度 继承 

虽然 在 现实 生活 中 ， 继 承 大 量 财富 是 无 比美 妙 的 事情 ， 但 在 OOP (面向 对 象 的 程序 
设计 ) 中 过 度 继承 会 成 为 麻烦 。 虽 然 Queue2 的 实现 简单 直接 ， 类 Queue2 继承 了 List 
所 有 的 属性 (包括 违背 队列 精神 的 方法 )， 这 是 一 个 问题 。 为 了 说 明 这 一 点 ， 让 我 们 考虑 
下 列 Queue2 对 象 ， 

>>> q2 

[5 3 天 

oueue2 的 实现 允许 我 们 从 队列 中 间 移 除 一 个 项 : 

>>> q2.pop(1) 

* 


>>> gq2 
[5, 9] 


它 同 样 允 许 我 们 在 队列 中 间 插 入 一 个 项 : 

S33 q2. insert(1s11) 

25> V2 

[有 

因此 7 在 $ 之 前 获得 服务 ， 而 11 在 队列 中 插入 到 9 之 前 ， 从 而 违背 了 队列 精神 。 由 
于 继承 了 所 有 的 list 方法 ， 我们 不 能 宣称 类 Queue2 严格 遵循 一 个 队列 的 精神 。 


8.6 ”用 尸 自 定义 异常 
我 们 在 8.4 节 开 发 的 类 oueue 的 实现 存在 一 个 问题 。 当 试图 从 一 个 空 的 队列 出 队 时 会 
发 生 什么 情况 ?让 我 们 来 验证 。 首 先 创 建 一 个 空 的 队列 : 
>>> queue = Queue() 
接着 ， 我 们 答 试 出 队 : 
>>> queue .dequeue () 
Traceback (most recent call last): 
File "<pyshell#185>", line 1, in <module> 
queue .dequeue() 
File "/Users/me/ch8.py", 
line 156, in dequeue 


return self.q.pop(0) 
IndexError: pop from empty list 


引发 了 一 个 IndexError 异常 ， 因 为 我 们 尝试 从 一 个 空 列表 seLf.d 的 索引 0 移 除 一 个 
项 。 这 有 什么 问题 吗 ? 

这 个 问题 也 不 例外 : 就 像 弹 出 一 个 空 列表 ， 当 我 们 试图 从 一 个 空 队列 出 队 一 个 项 时 ， 
没有 其 他 合理 操作 。 这 种 问题 就 是 一 种 异常 。 一 个 IndexError 异常 和 相关 的 消息 ' pop 
from empty 1list' 对 于 使 用 Queue 类 的 开发 人 员 没 有 帮助 ， 因 为 他 /她 有 可 能 不 知道 
Queue 容器 使 用 了 一 个 List 实例 变量 。 

对 开发 人 员 更 有 用 的 可 能 是 一 个 名 为 EmptyQueueError 的 异常 ， 其 输出 信息 
为 'dequeue from empty queue'。 总 而 言 之 ,定义 日 己 的 异常 类 型 而 不 是 依赖 于 通用 
的 内 置 的 异常 类 (例如 IndexError) 第 笛 是 一 个 不 错 的 主意 。 例 如 ， 一 个 用 户 目 定义 类 可 
以 用 于 定制 处 理 和 报告 错误 。 

为 了 获取 更 多 有 用 的 错误 信息 ， 应 该 了 解 如 下 两 件 事情 : 

1. 如 何 定义 一 个 新 的 异常 类 

2. 在 程序 中 如 何 抛 出 一 个 异常 

接 下 来 将 首先 讨论 第 二 点 。 


8.6.1 抛 出 一 个 异常 


根据 我 们 目前 为 止 的 经 验 ， 当 程序 执行 过 程 中 出 现 异 稼 时 ， 它 会 被 Python 解释 需 
抛 出 ， 因 为 出 现 了 错误 情况 。 我 们 已 经 看 到 了 一 种 不 是 因为 错误 而 造成 的 异常 : 它 是 
KeyboardInterrupt 异常 ， 通 常 由 用 户 引 发 。 用 户 通过 同时 按键 【 Ctrl+C |】 终止 一 个 无 
限 循环 时 ， 会 引发 KReyboardInterrupt 异常 。 例 如 : 

>>> while True: 


pass 


Traceback (most recent call last): 
File "<pyshell#210>", line 2, in <module> 
pass 
KeyboardInterrupt 


(无 限 循环 被 NN 异常 中 渐 ,) 
事实 上， 用 户 可 以 引发 任何 类 型 的 异 帝 ， 而 不 仅仅 是 KeyboardInterrupt 异常 。 
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Python 语句 raise 强制 引发 一 个 给 定 类 型 的 异 帝 。 下 面 是 如 何在 解释 需 命 令 行 中 引发 一 个 
ValueError 异常 的 例子 : 


>>> raise ValueError() 
Traceback (most recent call last): 
File "<pyshell#24>", line 1, in <module> 
raise ValueError() 
ValueError 


请 回顾 ValueErzor 只 是 一 个 碰巧 为 异常 类 的 类 。raise 语 句 包 含 一 个 关键 字 
raise， 紧 跟 一 个 异常 构造 函数 (例如 ValueError())。 执 行 该 语句 引发 一 个 异常 。 如 果 
异常 没有 被 try/except 语句 处 理 ， 则 程序 中 断 运 行 ， 默 认 的 异常 处 理 程序 在 命令 行 输出 
错误 信息 。 

异常 构造 限 数 可 以 融 输 入 参数 ， 用 于 提供 有 关 错 误 原 因 的 信息 : 


>>> raise ValueError('Just joking ...') 
Traceback (most recent call last): 
File "<pyshell#198>", line 1, in <module> 
raise ValueError('Just joking ...') 
ValueError: Just joking ... 


可 选 的 参数 是 与 异常 对 象 相关 联 的 字符 串 信息 : 事实 上 ， 它 是 异常 对 象 的 非 正 式 字符 串 
表示 形式 , 即 str () 方法 返回 的 内 容 ， 调 用 print() 因数 输出 的 内 容 。 

在 我 们 的 两 个 例子 中 ， 我们 证 明了 一 个 异常 可 以 被 引发 ,不管 它 是 否 有 意义 。 我 们 在 下 
一 个 练习 题 中 再 次 强调 了 这 一 


是 重新 实现 类 Queue 的 oe ne )， 当 尝试 从 一 个 空 队列 中 出 
队 时 ，3 引 发 一 个 KReyboardInterrupt 异种 (这 种 情 vd 该 异常 并 不 合适 )， 错 误 信 息 
为 'dequeue from empty queue' ee 这 才 是 合适 的 错误 信息 ): 


>>> queue = Queue() 
>>> queue .dequeue() 
Traceback (most recent call last) : 
File "<pyshell#30>", line 1, in <module> 
queue .dequeue() 
File "/Users/me/ch8.py", line 183, in dequeue 
raise KeyboardInterrupt('dequeue from empty queue ') 
KeyboardInterrupt: dequeue from empty queue 


8.6.2 用户 自 定义 异常 类 


接 下 来 摘 述 如 何 定 义 我 们 自己 的 异常 类 ， 

每 个 内 置 的 异常 类 都 是 类 Exception 的 子 类 。 事 实 上 ,定义 一 个 新 的 异常 类 ， 只 需要 
直接 地 或 者 间接 地 把 类 定义 成 为 Exception 的 一 个 子 类 。 就 这 么 简单 。 

作为 示例 ， 下 面 我 们 定义 了 一 个 新 的 异常 类 MyError， 其 功能 与 Exception 类 相同 : 


>>> class MyError (Exception) : 
pass 


这 个 类 只 包含 从 Exception 继承 的 属性 ，pass 语句 是 必需 的 ， 因 为 class 语句 要 
求 一 个 缩 进 语句 块 。) 让 我 们 验证 一 下 是 否 可 以 引发 MyError 异常 : 
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>>> raise MyError('test message') 
Traceback (most recent call last): 
File "<pyshell#247>", line 1, in <module> 
raise MyError('test message') 
MyError: test message 


注意 ， 我 们 也 可 以 把 错误 信息 'test message' 与 异常 对 象 关联 在 一 起 。 


8.6.3 改进 类 oueue 的 封装 

本 节 一 开始 时 我 们 就 指出 ， 从 一 个 空 的 队列 中 出 队 将 引发 异常 ， 并 输出 与 队列 无 
关 的 错误 信息 。 我 们 现在 定义 一 个 新 的 异常 类 EmptyQueueError， 并 重新 实现 方法 
dequeue( )， 当 在 一 个 空 的 队列 上 调用 方法 dequeue( )， 将 引发 一 个 异常 。 

我 们 选择 实现 新 的 异常 类 ， 而 没有 添加 任何 方法 : 


模块 : ch8.py 


class EmptyQueueError (Exception) : 
pass 


类 gueue 的 新 的 实现 如 下 所 示 ， 包 括 方法 dequeue 的 一 个 新 的 版 本 ， 其 他 Queue 方 
法 保持 不 变 。 


模块 : ch8.py 


class Queue: 


， 一 个 典型 的 队列 类 ， 
# 此 处 为 方法 init _ ()、enqueue ()、isEmpty ()、 
# repr {), .len (ts eq (的 实现 


def dequeue(self) : 
if len(self) == 0: 
raise EmptyQueueError('dequeue from empty queue') 
return self.qg.pop(0) 


有 了 这 个 新 的 Queue 类 ， 当 试图 从 一 个 空 的 队列 中 出 队 时 ， 可 以 获得 更 多 有 意义 的 错 
误 信息 : 
>>> queue = Queue() 
>>> queue .dqequeue () 
Traceback (most recent call last): 
File "<pyshell#34>", line 1, in <module> 
queue .dequeue() 
File "/Users/me/ch8.py", line 186, in dequeue 
raise EmptyQueueError('dequeue from empty queue') 
EmptyQueueErTror : dequeue from empty queue 


我 们 有 效 地 隐藏 了 类 Queue 的 实现 细节 。 


8.7 电子 教程 案例 研究 : 索引 和 和 迭 代 咒 


在 案例 研究 CS.8 中 ,我 们 将 学 习 如 何 使 容器 类 更 像 一 个 内 置 类 。 我 们 将 讨论 如 何 使 容 
器 中 的 项 能 够 使 用 索引 来 访问 ， 以 及 如 何 实现 使 用 for 循环 对 容器 中 的 项 进行 迭代 。 
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8.8 ”本章 小 结 


在 本 章 中 ， 我 们 介绍 了 如 何 开 发 新 的 Python 类。 我们 还 解释 了 面向 对 象 程序 设计 
(OOP ) 理念 的 优点 ， 并 讨论 了 将 在 本 董 和 后 续 曹 节 中 使 用 的 核心 OOP 概念 。 

Python 中 的 一 个 新 类 使 用 class 语句 来 定义 。 类 语句 的 主体 包含 类 的 属性 的 定义 。 属 
性 是 类 的 方法 和 变量 ,指定 类 属性 和 类 的 实例 能 执行 什么 操作 。 一 个 类 的 对 象 可 以 被 用 户 通 
过 方法 调动 (而 无 须 了 解 这 些 方法 的 实现 细节 ) 来 操作 的 思想 被 称 为 抽象 。 抽 象 促进 软件 开 
发 ， 因 为 程序 员 抽 象 地 使 用 对 象 ( 即 通过 “抽象 ”方法 名 而 不 是 “具体 ”代码 )。 

为 了 使 抽象 变 得 有 益 ,“ 具 体 ” 代 码 和 与 对 象 相关 的 数据 必须 进行 封装 (即使 得 对 使 用 
对 象 的 程序 “不 可 见 ”)。 之 所 以 可 以 实现 封 交 是 因为 : (1 ) 每 个 类 定义 一 个 名 称 空间 ， 类 
属性 (变量 和 方法 ) 在 该 名 称 空间 中 生存 ; (2 ) 每 个 对 象 都 有 一 个 名 称 空间 ， 并 继承 类 属性 ， 
实例 属性 在 其 中 生存 。 

为 了 实现 一 个 新 的 用 户 自 定义 类 的 封装 ， 可 能 需要 为 它 定 义 类 特定 的 异常 。 其 原因 是 ， 
如 果 调 用 类 对 象 上 的 方法 时 引发 异 第 ， 则 异常 类 型 和 错误 消 且 应 该 对 类 的 用 户 具 有 意义 。 出 
于 这 个 原因 ， 我 们 在 本 章 中 还 介绍 了 用 户 自 定义 的 异常 。 

OOP 是 一 种 程序 设计 方法 ， 它 通过 使 用 对 象 和 将 代码 构造 成 用 户 自 定义 的 类 来 实现 模 
块 化 代码 。 虽 然 我 们 从 第 2 章 就 开始 处 理 对 象 ， 但 本 章 才 最 终 展 示 『 OOP 方法 的 好 处 。 

在 Python 中 ， 可 以 为 用 户 自 定义 类 实现 诸如 + 和 = 的 运算 人行。 根据 操作 数 的 类 型 ， 运 
算 符 可 以 具有 不 同 的 、 新 的 意义 的 OOP 特性 被 称 为 运算 符 重 载 (这 是 多 态 性 的 OOP 概念 
的 一 个 特例 )。 运 算 符 重 载 促进 了 软件 的 开发 ， 因 为 (良好 定义 的 ) 运算 符 具有 直观 的 意义 ， 
使 代码 看 起 来 稀 跑 和 简洁 。 

可 以 定义 一 个 新 的 用 户 自 定义 类 来 继承 已 经 存在 的 类 的 属性 。 这 个 OOP 特性 被 称 为 类 
继承 。 当 然 ， 代 码 重 用 是 类 继承 的 终极 优越 性 。 我 们 将 在 第 9 曹 开 发 图 形 化 用 户 界 面 和 第 
11 草 中 开发 HTML 解析 需 过 程 中 大 量 使 用 类 继承 。 


8.9 ”练习 题 告 案 


8.1 方法 getx() 除了 self 之 外 不 市 任何 其 他 参数 ， 返 回 定 义 在 名 称 空间 self 中 的 xcoord。 
def getx(self): 
， 返回 x 坐标，' 
return self.xcoord 
8.2 ”part(a) 的 示意 图 如 图 8-9a 所 示 。 对 于 part(b)， 可 以 通过 
的 示意 图 如 图 8-9b 所 示 。 最 后 一 条 语句 a.version 返 
a.version 在 名 称 空间 a 创建 了 名 称 version。 


填充 问号 部 分 内 容 。part(c) 


执行 合 令 ， 
可 字符 串 ' test'。 这 是 因为 赋值 语句 


加 | 
version version 
类 Test 类 Test 
version 


对 象 a 对 象 b 对 象 a 对 象 b 


a) b) 
图 8-9 练习 题 8.2 的 答案 


A 
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8 .3 


8.4 


8.5 


8.0 


8.7 


创建 Rectangle 时 没有 任何 实例 变量 。 方 法 setsize() 应 该 创建 并 初始 化 实例 变量 来 存储 矩 
形 的 宽 和 长 。 这 些 实例 变量 被 方法 perimeter() 和 areal() 使 用 。 类 Rectangle 的 实现 如 
下 所 示 : 


class Rectangle: 
' 表示 矩形 的 类 ， 
def setSize(self, xcoord, ycoord): 
self.x = xcoord 
self.y = ycoord 


def perimeter(self).: 
' 返回 矩形 的 周 长 ， 


return 2 * (self.x + self.y) 


def area(self): 
' 扳 回 和 矩形 的 面积 ， 


return self.x * self.y 


添加 一 个 ”init _() 方法 到 类 中 ， 它 包括 输入 参数 species 和 language 的 默认 值 : 


def __init__(self, species='animal'’, language='make sounds'): 
”构造 函数 ， 
self.spec = species 
self.lang = language 


因为 我 们 允许 构造 也 数 不 市 参数 或 者 审 一 个 扑克 有 牌 列表 参数 ， 因 此 需要 实现 也 数 ”init _ 
( ) ， 寓 一 个 有 默认 值 的 参数 。 这 个 默认 值 实际 上 应 该 是 包含 标准 52 张 扑 殉 牌 的 的 列表 ， 但 还 没 
有 创建 这 个 列表 。 我 们 选择 把 默认 值 设置 为 None (类 型 NoneType 的 一 个 值 ， 表 示 无 值 )。 于 
是 可 以 按 如 下 方式 实现 init  (): 


def __init._(self, cardList=None): 
' 构造 函数 ， 
if cardList != None:# 提供 了 输入 扑克 牌 列 表 
self.deck = cardList 
else: # 没有 提供 输入 扑克 牌 列表 
# self.deck 是 一 个 标准 的 52 张 扑克 上牌 列表 


运算 符 repr( ) 返回 的 字符 串 必须 看 起 来 像 构 造 一 个 card 对 象 的 语句。 如 果 两 张 被 比较 的 牌 的 
点 数 和 花色 相同 ， 则 运算 符 == 返回 True。 


class Card: 
# 其 他 Card 方法 
def __repr__(self) : 
:返回 规范 化 表示 ， 
大 "ardtC 二 
def __eq__(self，other) : 
' self = other 上 ， 如 果 点 数 和 花色 相同 ， 


return self.rank == other .rank and self.suit == other .SUit 
实现 结果 如 下 所 示 。 如 果 两 副 牌 包含 相同 的 扑克 牌 且 顺序 相同 ， 则 运算 符 == 认为 两 副 牌 相等 。 


class Deck: 
# 其 他 Deck 方法 
def __len.__(self): 
' 返回 扑克 牌 中 牌 的 张 数 ， 


return len(self .deck) 
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def __repr__(self) : 


， 返回 规范 字符 串 表示 形式 ， 
return 'Deck({})'.format(self .deck) 


def _ eq__(self, other): 
''， 如 果 两 副 牌 包含 相同 扑克 牌 且 顺 序 相同 ， 则 返回 True ''' 


return self.deck == other.deck 
8.8 Vector 类 的 完整 实现 结果 如 下 : 


class Vector(Point): 
”一 小 三 维 向 量 类 ， 
def mul (seolf, Y): 
' 向 量 乘法 ， 


return self.x * Vv.x + self.y 本 VY.y 


def _ add (self, v): 
' 向 量 加 法 ， 


return Vector(self.xt+tv.x, self.y+v.y) 


def __repr__(self) : 
' 返回 规范 字符 串 表 示 形 式 ， 
return 'Vector{}'.format(self .get()) 


8.9 如 果 Queue 对象 ( 即 selif) 的 长 度 为 0， 则 引发 一 个 KeyboardInterrupt 异常 : 


def dequeue(self) : 
''， 从 队列 的 头 部 移 除 并 返回 项 
如 果 队 列 为 空 ， 则 引发 KeyboardInterrupt 异常 ''' 
if len(self) == 0: 
raise KeyboardInterrupt('dequeue from empty queue') 


return self.q.pop(0) 


8.10 “ 习 卉 


8.10 在 类 Point 中 添加 一 个 方法 aistance( )， 带 一 个 输入 参数 : 另 一 个 Point 对象。 返回 (从 
调用 方法 的 点 开始 ) 到 男 一 个 点 的 距离 。 


>>> C = Point() 
>>> c.setx(0) 
>>> c.sety(1) 
>>>-d = Point() 
>>> d.setx(1) 
>>> d.sety(0) 


>>> Ct.digstancetd) 
1.4142135623730951 


8.11 在 类 Animal 中 添加 方法 setAge() 和 getAge()， 用 于 设置 和 获取 Animal 对 象 的 年 龄 。 


>>> flipper = Animal() 

>>> flipper.setSpecies('dolphin') 
>>> flipper.setAge(3) 

>>> flipper.getAge() 


8.12 在 类 Point 中 添加 方法 up()、down()、left() 和 right(), 分 别 将 Point 对 象 在 对 应 
方向 上 移动 一 个 单位 距离 。 每 个 方法 的 实现 不 应 该 直接 修改 实例 变量 x 和 y， 而 应 该 间接 调用 
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既 存 方法 move( )。 


>>> a = Point(3, 4) 
>>> a.left() 

>>> a.get() 

CO 


在 类 Rectangle 中 添加 一 个 构造 吨 数 ,使 得 创建 Rectangle 对 象 时 可 以 设置 矩形 的 长 和 宽 。 
如 果 没 有 指定 长 各， 则 使 用 默认 值 1。 

>>> rectangle = Rectangle(2, 4) 

>>> rectange.perimeter() 

412 

>>> rectangle = Rectangle() 


>>> Tectangle.area() 
1 


把 下 列 重 载运 算 符 表达 式 翻 译 成 相应 的 方法 调用 : 
(a)x>y 
《 寺 居 六 
(c)x%y 
(dy wl y 
(e) x ory 
为 类 card 重 载 合 适 的 运算 符 ， 使 得 可 以 根据 点 数 比 较 扑 死 牌 大 小 : 
Ss»>> Canada 7 二 < Cardt", 'S 
True 
> Croat 二 CC 
False 
S55 Cardt's3:,. “HD = Card("a:, wwW) 
True 
S35 Card('3’, '') 3= Card(re' , ©!) 
False 
实现 一 个 类 myInt， 其 行为 几乎 和 类 int 一 致 ， 除 了 尝试 累加 一 个 类 型 myInt 对 象 时 ， 会 发 
生 特 殊 的 行为 : 
>>> x = myInt(5) 
3>>》 严 襟 湛 
20 
> 2 林 66) 
50 
>>> x+6 
'Whatever ... 
实现 自 定义 字符 串 类 mystr， 其 行为 类 似 于 类 str， 除了: 
e 加 法 (+) 运算 符 返 回 两 个 字符 串 的 长 度 之 和 (而 不 是 字符 串 拼接 )。 
e 乘法 (*) 运算 特 返 回 两 个 字符 串 的 长 度 之 积 。 
这 两 个 运算 符 的 两 个 操作 数 都 假设 为 字符 串 。 如 果 第 二 个 操作 数 不 是 字符 串 ， 则 实现 的 行 
为 可 以 为 未 定义 。 
> myStr(’'hello') 
> > > 十 也 玫 和 站 癌 玫 本 人 
3 


>>> XX * 'UNiVerse' 


40 
开发 一 个 内 置 1ist 类 的 子 类 myList。myList 和 1ist 之 间 的 唯一 区 别 是 重 写 了 sort 方法 。 
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myList 容 融 的 行为 与 普通 列表 一 致 ， 除 了 下 列 现象 : 


DEF = nllist(t[1, 2 3]) 
x 

E20 这 坟 
x.reverse() 

> 

了 本 

33 E22] 


3 BO0Ft() 
You WIish. ;: 


假设 使 用 8.5 节 的 类 Queue2 执行 下 列 语句 : 


>>> queue2 = Queue2(['a', 'b', 'c']) 

>>> duplicate = eval(repr(queue2)) 

>>> duplicate 

Le 

>>> duplicate.enqueue('d') 

Traceback (most recent call last): 

File "<pyshell#22>", line 1, in <module> 

duplicate.enqueue('d') 

AttributeError: 'list' object has no attribute 'enqueue' 


请 解释 错误 原因 ， 并 提出 解决 方案 。 


思考 题 
开发 一 个 BankAccount 类 ， 支 持 下 列 方法 : 
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。  _init _(): 将 银行 账户 余额 初始 化 为 输入 参数 的 值 ， 如 果 没 有 给 定 输入 参数 ， 则 为 0 


e withdraw(): 带 一 个 amount 输入 参数 ， 并 从 账户 余额 中 提取 amount 指定 的 款额 
e deposit(): 带 一 个 amount 输入 参数 ， 并 将 amount 指定 的 款额 存储 到 银行 账户 


e balance(): 返回 账户 余额 


>>> x = BankAccount (700) 
>>> x.balance() 

700.00 

>>> x.withdraw(70) 

>>> x.balance() 

630.00 

>>> x.deposit(7) 
>>>-x.balance() 

637 .00 


实现 一 个 类 Polygon， 对 正 多 边 形 进行 抽象 ， 并 文 持 下 列 方法 : 
e。 init _(): 构造 本 数 ， 带 两 个 参数 : 一 个 正 n 边 形 对 象 的 边 数 和 边 长 
e perimeter(): 返回 下 边 形 的 周 长 
e areal(): 返回 正 半 边 形 的 面积 
注意 , 边 长 为 的 正 n 边 形 的 面积 为 : 


sn 


ttan 
n 
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>>> p2 = Polygon(6, 1) 
>>> p2.perimeter() 

6 

>>> p2.area() 
2.5980762113533165 


实现 类 Worker， 文 持 下 列 方法 : 

e init  (): 构造 阴 数 ， 带 两 个 输入 参数 : 工人 的 姓名 (字符 串 ) 和 小 时 工资 (数值 ) 
e changeRate( ): 市 一 个 新 的 小 时 工资 作为 输入 参数 ， 修 改 工 人 的 小 时 工资 

e pay(): 市 一 个 工作 时 长 输入 参数 ， 输 出 : 'Not Implemented' 

接 下 来 开发 Worker 的 子 类 : HourlyWorker 和 SalariedWorker。 两 个 子 类 都 重 写 
继承 的 方法 pay ( ) 来 计算 工人 的 周 薪 。 计 时 工 按 实际 工时 支付 每 小 时 工资 ， 超 过 40 小 时 的 加 
班 费 为 双 倍 工 资 。 计 薪 工 人 的 工资 是 40 小 时 的 工资 ,不管 工作 时 间 是 多 少 。 因 为 与 工作 时 长 无 
关 ， 故 SalariedWorker 的 方法 pay() 可 以 不 之 参数 调用 ， 
>>> wl = Worker(' Jjoe', 15) 
>>> wl.pay(35) 

Not implemented 

>>> w2 = SalariedWorker('Sue', 14.50) 

>>> w2.pay() 

580.0 

>>> w2.pay (60) 

580.0 

>>> W3 = HourlyWorker('Dana' , 20) 

>>> w3.pay(25) 

500 

>>> w3.changeRate(35) 

>>> w3.pay (25) 

S75 

创建 一 个 类 Segment ， 表 示 平 面 上 的 一 个 线段 ， 支 持 下 列 方法 : 
e。 init _(): 构造 好 数 ， 带 两 个 输入 参数 : 一 对 表示 线段 端点 的 Point 对 象 
e length(): 返回 线段 的 长 度 

。 slope(): 返回 线段 的 斜率， 如 果 和 斜率 无 穷 大 ， 则 返回 None 

运行 效果 如 下 : 
>>> pl = Point(3,4) 
>>> p2 = Point() 
>>> s = Segment (pl1, p2) 
>>> s.length() 

5 ,车 

>>> s.slope() 

0 .75 

实现 一 个 类 Person， 支 持 下 列 方法 : 

e init _(): 构造 柄 数 ， 带 两 个 输入 参数 : 姓名 (字符 串 ) 和 出 生年 份 (整数 ) 
e age(): 返回 年 龄 

e name(): 返回 姓名 

使 用 标准 库 模块 time 中 的 1ocaltime() 轴 数 计算 年 龄 。 
开发 一 个 类 Textfile， 提 供 分 析 文 本 文件 的 方法 。 类 Textfile 文 持 一 个 构造 消 数 ， 带 一 
个 输入 参数 : 一 个 文件 名 (字符 串 )， 初 始 化 Textfile 对 象 与 对 应 的 文本 文件 关联 。 要 求 
Textfile 类 支持 如 下 方法 : nchars()、nwords() 和 nlines()， 分 别 返回 关联 文本 文件 
的 字符 数 、 单 词 数 和 行 数 。 要 求 类 还 支持 方法 read() 和 readlines()，, 分 别 返 回 文本 文件 
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的 内 容 (字符 串 ) 和 内 容 行列 表 ， 类 似 于 文件 对 象 对 应 的 功能 。 
最 后 ， 要 求 类 支持 方法 grep( )， 带 一 个 输入 参数 : 目标 字符 串 ， 在 文本 文件 中 查找 包 
售 目 标 字符 串 的 行 。 该 方法 返回 文件 中 包含 目标 字符 串 的 行 。 另 外 ， 要 求 输出 行 号 ， 行 号 从 0 
开始 。 
>>> t = Textfile('raven .txt :1) 
>>> t.nchars() 
6299 
>>> t.nwords() 
1125 
>>> t.nlines() 
126 
>>> print(t.read()) 
Once upon a midnight dreary, while I pondered weak and weary, 


Shall be lifted - nevermore! 
> t.grep('nevermore') 
75: 0f “Never-nevermore.. 
89: She shall press, ah, nevermore! 
124: Shall be lifted - nevermore! 
在 思考 题 8.25 的 类 Textfile 中 ， 添 加 方法 words ( ) ,不 带 输入 参数 ， 返 回 文件 中 的 不 重复 
单词 的 列表 。 
在 思考 题 8.25 的 类 Textfile 中 ， 添 加 方法 occurrences ( ) ， 不 带 输入 参数 ， 返 回 一 个 字 
内 ,映射 文件 中 的 每 个 单词 ( 键 ) 到 单词 在 文件 中 出 现 的 次 数 ( 值 )。 
在 思考 题 8.25 的 类 Textfile 中 ， 添 加 方法 average( ) ， 不 带 输 入 参数 ， 返 回 一 个 包含 以 下 
内 容 的 元 组 (tuple) 对 象 : ( 1 ) 文件 中 每 行 平均 的 单词 个 数 ; (2 ) 单词 数 最 多 的 句子 包含 的 单词 
个 数 ; (3 ) 单词 数 最 少 的 句子 包含 的 单词 个 数 。 可 以 假定 句子 中 单词 的 分 隔 符 为 : "12."。 
实现 类 Hand， 表 示 一 手 扑克 牌 。 要 求 类 包含 一 个 构造 函数 : 带 一 个 玩家 ID (字符 串 ) 作为 输入 
参数 。 要 求 类 支持 方法 addcard( ) ， 带 一 张 扑 克 牌 作为 输入 参数 ， 把 它 加 入 到 一 手 扑 克 牌 中 。 
要 求 文 持 方法 showHand( ) ， 按 下 列 格式 显示 玩家 手中 的 扑克 牌 。 
>>> hand = Hand('House') 
>>> deck = Deck() 
>>> deck.shuffle() 
>>> hand.addCard(deck.dealCard()) 
>>> hand.addCard(deck.dealCard()) 
>>> hand.addCard(deck.dealCard()) 
>>> hand. showHand() 
House: 10 MV 8 会 2m 
使 用 本 章 开 发 的 card 类 和 Deck 类 以 及 思考 题 8.29 的 Hand 类 ， 重 新 实现 案例 研究 CS.6 中 的 
二 十 一 点 扑克 牌 游戏 应 用 程序 。 
实现 类 Date， 支 持 下 列 方法 : 
。 init  (): 构造 函数 ， 不 带 输 入 参数 ,初始 化 Date 对 象 为 当前 日 其 
e display(): 市 一 个 格式 参数 ， 按 要 求 格 式 显 示 日 期 
使 用 标准 库 模 块 time 中 的 函数 1ocaltime() 来 获取 当前 时 间 。 格 式 参数 是 一 个 字符 串 : 
e MDY : MM/DD/YY (e.g., 02/18/09) 
e MDYY : MM/DD/YYYY (e.g., 02/18/2009) 
e ”DMY : DD/MM/YY (e.g., 18/02/09) 
e ” DMYY : DD/ MM/YYYY (e.g., 18/02/2009) 
e ”MODY : Mon DD,YYYY (e.g., Feb 18, 2009) 
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要 求 使 用 标准 库 模 块 time 中 的 限 数 localtime() 和 strftime()。 

>>> x = Date(l) 

>>> x.display('MDY') 

'027/18/09: 

>»3> Xdisplay( MODY ') 

'Feb 18, 2009' 

开发 一 个 类 craps， 人 允许 用 户 在 计算 机 上 玩 山 子 游 戏 。( 般 子 游戏 规则 在 思考 题 6.31 中 描述 。) 

要 求 类 Craps 支持 下 列 方法 : 

。 init  (): 首先 滚动 一 对 仍 子 。 如 果 滚 动 的 结果 值 ( 即 两 个 仍 子 的 和 ) 为 7 或 者 11， 则 
输出 赢 的 提示 信息 。 如 果 滚 动 的 结果 值 为 2、3 或 者 12， 则 输出 输 的 提示 信息 。 对 于 所 有 其 
他 滚动 的 结果 值 ， 输 出 一 个 通知 用 户 重 新 掷 般 子 的 信息 。 

e forPoint() : 生成 一 对 贫 子 的 滚动 的 结果 值 ， 根 据 滚动 的 结果 值 ， 输 出 对 应 的 三 种 信息 之 
一 (如 下 所 示 ): 

>>> C = Craps() 

Throw total: 二，。，You won'! 

>>> C = Craps() 

Throw total: 2; YOU Log 

>>> C = Craps() 

Lrow totals bb, Trow tor Polnt. 

>>> € .forPoint'() 

Thnrow total: ©6,. Throw 二 OF Point. 

>35 &. forPpoint() 

Throw total: 5. You vwon! 

>>> C = Craps() 

Ihrow total: 4; Throw for Point. 


>>> €,.f0rPOint() 
Ihrow totalse ££: You lost! 


实现 类 Pseudorandom， 使 用 线性 同 余 发 生 需 (1linear congruential generator) 生成 一 系列 的 伪 
随机 整数 。 线 性 同 余 法 从 一 个 给 定 的 种 子 数 x 开 始 产生 一 个 数字 序列 。 序 列 中 的 每 个 数 将 通过 
在 前 一 个 序列 数 x 上 应 用 (数学) 因数 ,jx) 而 求 得 。 精 确 孔 数 ftx) 由 三 个 数 定 义 : a ( 乘 子 ).c( 增 
量 ) 和 m ( 模 数 ): 
f(x)=(axtc)mod m 

例如 ， 如 果 m=31、a=17 和 c=7， 则 从 种 子 x=12 开始 ， 线 性 同 余 方法 将 生成 下 列 数 值 
序列 : 

ld 2 2 

因为 12)=25、f25)=29、f(29)=4， 等 等 。 要 求 类 Pseudorandonm 支持 下 列 方法 ; 
e init _(): 构造 函数 ,种 四 个 输入 参数 : a、x、c 和 m， 并 初始 化 Pseudorandom 对 象 
e next(): 产生 并 返回 伪 随机 序列 中 的 下 一 个 值 


>> x = pseudorandom(17，12，7，31) 
3》 总 ,WW6RE (7 

多 5 

>>> x.next() 

29 

>2> anext() 

4 


实现 一 个 容 融 类 stat， 存 储 一 系列 值 并 提供 关于 这 些 数 值 的 统计 信息 。 它 文 持 重 载 构 造 隐 数 ， 
用 于 初始 化 容 右 ， 还 文 持 下 列 方法 : 
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> 和 a 

>>> s.add(2) # 把 2 添加 到 Stat 容器 
>>> s.add(4) 

>>> s.add(6) 

>>> s.add(8) 

>>> s.min() # 返回 容器 中 的 最 小 值 

2 

>>> s.max() # 返回 容器 中 的 最 大 值 

8 

>>> s.sum() # 返回 容器 中 的 值 之 和 
20 

>>> len(s) # 返回 容器 中 项 的 个 数 

4 

>>> s.mean() # 返回 容器 中 项 的 平均 值 
Ss 

>>> 4 in s# 如 果 在 容器 中 存在 ， 则 返回 True 
True 


>>> s.clear() # 清空 序列 


像 队列 一 样 ， 堆 栈 是 一 种 序列 容器 类 型 ， 支 持 非 常 受 限 的 访问 方法 : 所 有 插入 和 清除 都 来 自 
堆栈 的 一 端 (通常 称 为 堆栈 的 顶部 )。 实 现 一 个 容器 类 Stack， 用 于 实现 一 个 堆栈 。 要 求 它 是 
object 的 一 个 子 类 ， 支 持 len( ) 重 载 运算 符 ， 并 支持 下 列 方 法 : 
e push ( ) : 市 一 个 项 作为 输入 参数 ， 把 该 项 压 人 到 堆栈 的 顶部 
e pop(): 从 堆栈 项 部 返回 并 移 除 一 个 项 
e。 isEmpty(): 如 果 堆 栈 为 空 则 返回 True， 否 则 返回 False 

还 应 该 确保 堆栈 可 以 按 如 下 显示 输出 。 堆 栈 是 通常 被 称 为 后 进 先 出 ( LIFO) 的 容器 ， 因 为 
最 后 插入 的 项 最 先 被 移 除 。 


>>> s = Stack() 

>>> s.push('plate 1') 
>>> s.push('plate 2') 
>>> s.push('plate 3') 
>>> s 

L*ylate E', "pliate 2+ "plate 
>>> len(s) 

3 

>>> s.pop() 

‘pliate 3 

>>> 8.Bop() 

'plate 2， 

>>> s .pop() 

‘plate 1' 

>>> s.isEmpty() 

True 


编写 一 个 名 为 PriorityQueue 的 容 髓 类 。 要 求 PriorityQueue 类 文 持 下 列 方法 : 
e。 insert(): 审 一 个 数值 参数 ， 把 该 数值 添加 到 容 需 中 
e min(): 返回 容 需 中 的 最 小 值 
e removeMin(): 移 除 容 吉 中 的 最 小 值 
e isEmpty(): 如 果 容 需 为 空 则 返回 True; 否则 返回 False 
要 求 还 支持 重 载运 算 符 len( ) 。 
>>> pq = PriorityQueue() 


>>> pq.insert(3) 
>>> pq.insert(1) 
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>>> pq.insert(5) 
>>> pq.insert(2) 
>>> pq. min() 


>>> pq.removeMin() 
>>> pq.min() 


>>> len(pq) 


>>> pq.isEmpty() 
False 


实现 类 Square 和 Triangle， 作 为 思考 题 8.21 的 类 Polygon 的 子 类 。 要 求 Square 类 和 
Triangle 类 都 重 载 构造 阴 数 ” init ,只 带 一 个 参数 1 (表示 边 长 )。 重 写 方 法 area( ) ， 
使 用 更 简单 的 方法 计算 面积 。 要 求 方法 init _ 使 用 父 类 的 ” init 方法 ,使 得 子 类 中 


不 用 定义 实例 变量 (1 和 nm)。 注 意 : 边 长 为 s 的 等 边 三 角形 的 面积 为 9xV314 
>>> S = Square(2) 
>>> s.perimeter() 

8 

>>> S.area() 

全 

>>> 七 = Triangle(3) 
>>> 七 .perimeter() 

9 

>>> 七 .area() 
6.3639610306789285 


实现 思考 题 8.24 中 的 类 Person 的 两 个 子 类 。 子 类 Instructor 支持 下 列 方法 : 
e init _(): 构造 图 数 ， 参 数 除 了 姓名 和 出 生年 份 外 ， 还 包括 学 历 
e degree(): 返回 教师 的 学 历 
类 Student 也 是 Person 的 子 类 ， 支 持 下 列 方法 : 
e init _(): 构造 也 数 ,参数 除了 姓名 和 出 生年 份 外 ， 还 包括 主 修 专业 
e major(): 返回 学 生 的 主 修 专业 
要 求 所 实现 的 三 个 类 的 运行 结果 如 下 : 


>X> XE = Instructor('Snith’', 1963, 'PhD'’) 
>>> x.agel) 


45 

>>> y = Student('Jones', 1987, ‘Computer Science') 
>>> y.age() 

21 


>>> y.major() 
'Computer Science' 
>>> x.degree() 


‘PHD' 
考虑 下 列 类 树 层次 结构 : 
Animal 
_ Mammal 
Cat | Dog Primate 


Hacker 


实现 六 个 类 ， 使 用 Python 继承 关系 来 建 模 这 个 分 类 法 。 在 类 Animal 中 ， 


实现 方法 
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speak( ) ， 该 方法 被 Animal 的 子 类 继承 。 完 成 六 个 类 的 实现 ， 使 它们 表现 下 列 行为 : 


>>> garfield = Cat() 
>>> garfield.speak() 
Meeow 

>>> dude = Hacker() 
>>> dude.speak( ) 
Hello world! 


在 思考 题 8.20 中 ， 类 BankAccount 的 实现 存在 一 些 问题 ， 描 述 如 下 : 


>>> x = BankAccount(-700) 
>>> X.balance() 
-700 
>>> x.withdraw(70) 
>>> x.balance() 
-770 
>>> x.deposit(-7) 
>>> x.balance() 
Balance: -777 
问题 是 : (1) 可 以 创建 一 个 余额 为 负数 的 银行 账户 ; (2) 取款 额 可 以 大 于 账户 余 
额 ; (3 ) 存款 额 可 以 为 负数 。 修 改 BankAccount 的 代码 ， 如 果 出 现 了 以 上 违规 操作 ， 则 
引 发 ValueError 异常 ， 并 输出 相应 的 信息 'Illegal balance'、'Overdraft' 或 
者 'Negative deposit'。 
>>> X = BankAccount2(-700) 
Traceback (most recent call last): 


ValueError: Illegal balance 
在 思考 题 8.40 中 ， 当 发 生 了 三 种 违规 操作 时 将 引发 一 个 通用 的 ValueError 异常 。 如 果 引 
发 更 具体 的 用 户 自 定 义 异 常 ， 则 会 更 具 可 用 性 。 定 义 可 能 会 引发 的 新 的 异常 类 Negative- 
BalanceError 、OverdraftError 和 DepositError。 此 外 ， 要 求 异常 对 象 的 非 正式 的 字 
符 串 表示 应 该 可 以 体现 诸如 此 类 的 余额 : 创建 负数 余额 银行 账户 、 透 支 或 者 负 存 款 。 

例如 ， 当 试图 创建 具有 人 负数 余额 的 银行 账户 时 ， 要 求 错 误 消 息 包括 假如 允许 银行 账户 创建 
时 所 产生 的 余额 : 
>>> x = BankAccount3(-5) 


Traceback (most recent call last): 


NegativeBalanceError: Account created with negative balance -5 


当 透 支 导致 负数 账户 余额 时 ， 也 要 求 错误 信息 包括 假如 允许 透支 导致 的 账户 余额 : 


>>> x = BankAccount3(5) 
>>> x.withdraw(7) 
Traceback (most recent call last): 


OverdraftError: Operation would result in negative balance -2 


如 果 尝 试 负数 存 蒜 ， 负 和 存 球 金 额 应 包含 在 错误 信息 中 : 


>>> x.deposit(-3) 
Traceback (most recent call last): 


DepositError: Negative deposit -3 


最 后 ， 使 用 这 三 个 新 建 的 异常 类 代替 ValueError， 重 新 实现 类 BankAccount。 
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本 章 介 绍 图 形 用 户 界 面 (GUI) 的 开发 知识 。 

当 你 使 用 计算 机 应 用 程序 时 ， 无论 它 是 Web 浏览 器 、 电 子 邮件 客户 端 、 计 算 机 游戏 、 
还 是 Python 集成 开发 环境 ( IDE)， 通 常 都 是 使 用 鼠标 和 键盘 来 和 图 形 用 户 界 面 进行 交互 的 。 
使 用 GUI 有 两 个 原因 : 其 一 ，GUI 为 程序 功能 提供 更 好 的 概览 视图 ; 其 二 ，GUI 使 得 应 用 
程序 更 加 容易 使 用 。 

为 了 开发 图 形 用 户 界面 ， 开 发 人 员 需 要 一 个 GUI 应 用 程序 编程 接口 (API)， 提 供 必 要 的 
GUI 工具 包 。Python 有 香干 个 GUI API。 本 教程 使 用 tkinter 模块 ， 它 是 Python 标准 库 的 一 
部 分 。 

除了 介绍 使 用 tkinter 进行 GUI 开发 的 知识 ， 本 曹 还 涉及 第 用 于 GUI 开发 的 基本 软件 开 
发 技术 。 我 们 引入 事件 驱动 程序 设计 ， 一 种 以 响应 事件 〈 例 如 按钮 单 击 ) 执行 任务 的 应 用 程 
序 开 发 方法 。 我 们 还 将 了 解 到 ， 理 想 情 况 下 ， 图 形 用 户 界面 可 以 开发 为 用 户 自 定义 类 ， 我 们 
借 此 机 会 再 次 展示 了 面 回 对 象 程序 设计 (OOP) 的 优越 性 。 


9.1 tkinter 图 形 用 户 界 面 开 发 基本 知识 


图 形 用 户 界 面 (GUI) 由 基本 的 可 视 化 构建 块 组 成 ， 例 如 按钮 、 标 签 、 文 本 输入 框 、 
菜单 、 复 选 框 和 深 动 条 等 ， 它 们 都 集中 排列 在 一 个 标准 窗口 中 。 构 建 块 通常 称 为 组 件 
( widget)。 为 了 开发 GUI， 开 发 者 需要 使 用 一 个 包括 这 些 组 件 的 模块 。 我 们 将 使 用 包含 在 标 
准 库 中 的 模块 tkinter。 

在 本 节 中 ， 我 们 将 介绍 使 用 tkinter 模块 进行 GUI 开发 的 基础 知识 : 如 何 创建 一 个 窗 
口 ， 如 何在 窗口 中 添加 文本 或 者 图 像 ， 如 何 控制 组 件 的 外 观 和 位 置 ， 等 等 。 


9.1.1 组 件 Tk: GUI 窗口 


在 我 们 的 第 一 个 GUI 示例 中 ， 我 们 将 构建 仅 由 一 个 窗口 组 成 的 、 不 包含 任何 其 他 内 容 
的 基本 GUI。 为 此 ， 我 们 首先 从 模块 tkinter 导入 类 Tk， 并 实例 化 类 型 Tk 的 一 个 对 象 : 


>>> from tkinter import Tk 
>>> root = Tk() 


一 个 Tk 对象 是 表示 GUI 窗口 的 GUI 组 件 ， 创 Sn k 
建 时 无 须 任何 参数 。 

如 果 你 执行 上 面 的 代码 ， 你 会 发 现 ， 创 建 一 个 
Tk( ) 组 件 ， 结 果 并 没有 在 屏幕 上 显示 一 个 窗口 。 为 
了 显示 窗口 ， 需 要 调用 Tk 的 方法 mainloop(): 


图 9-1 一 个 tkinter GUI 窗口 。 可 以 最 小 
>>> root .mainloop() sh bi 


现在 应 该 可 以 看 到 图 9-1 中 所 示 的 窗口 。 的 其 他 窗口 外 观 类 似 
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这 个 GUI 窗口 仅仅 包含 一 个 窗口 ， 没 有 其 他 任何 内 容 。 如 果 要 在 窗口 中 显示 文字 或 者 
图 片 ， 我 们 需要 使 用 tkinter 的 Label 组 件 。 


9.1.2 ”组件 Label: 显示 文本 


组 件 Label 可 以 用 于 在 窗口 中 显示 文本 。 让 我 们 通过 开发 一 个 GUI 版 本 的 经 典 
“Hello World” 应 用 程序 来 说 明 其 用 法 。 首 先 ， 除 了 从 tkintezr 导入 类 Tk， 我 们 还 需要 
时 大 关 Tabels， 


>>> from tkinter Import Tk, Label 
>>> root = Tk() 


然后 创建 一 个 Label 对 象 ， 显 示 文 本 “Hello GUI wor1d! ”: 
>>> hello = Label (master = root, text = 'Hello GUI world!') 

Label 构造 哨 数 中 的 第 一 个 参数 为 master， 指 定 Label 组 件 位 于 组 件 root 之 内 。 
GUI 通常 包 含 许多 以 分 层 方 式 组 织 的 组 件 。 当 定义 组 件 x 位 于 组 件 了 之 内 时 ,组件 Y 被 称 
为 组 件 X 的 父 组 件 ( 即 主 控 )。 

第 二 个 参数 为 text， 指 癌 Label 组 件 显 示 的 文本 。text 参数 是 二 十 几 个 可 选 的 构 
造 限 数 参 数 之 一 ， 它 们 用 于 指定 Label 组 件 (以 及 其 他 tkinter 组 件 ) 的 外 观 。 我 们 在 
表 9-1 中 列举 了 一 些 可 选 参数 ， 并 在 这 一 节 中 展示 它们 的 用 法 。 

虽然 Label 构造 哨 数 指定 标签 组 件 位 于 组 件 root 之 内 ,但 它 没 有 指定 标签 应 该 放置 
在 组 件 root 之 内 的 哪个 位 置 。 指 定 GUI 的 几何 形状 ( 即 组 件 在 其 父 组 件 中 的 位 置 ) 有 好 几 
种 方法 ,我们 将 在 本 节 后 面 更 详细 地 讨论 它们 。 指 定 一 个 组 件 在 其 父 窗口 位 置 的 一 个 简单 的 
方法 是 调用 组 件 的 方法 pack( ) 。 方 法 pack() 可 以 带 参数 以 指定 在 父 组 件 中 期 望 的 位 置 。 
如 果 没 有 指定 参数 ， 则 使 用 默认 的 位 置 (把 组 件 置 于 其 父 组 件 的 项 部 中 心 位 置 ): 

>>> hello.pack() # hello 署 于 其 父 组 件 的 顶部 中 心 位 置 


>>> root .mainloop() 


和 我 们 的 第 一 个 例子 一 样 ，mainloop( ) 方法 显示 GUI 界面 ， 如 图 9-2 所 示 。 


yA N tk 
Hello CUI world! 


图 9-2 一 个 文本 标签 。 创 建 Label 组 件 时 ， 如 果 指 定 了 text 参数 ， 则 会 显示 一 个 文本 标 
签 。 注 意 ， 标 签 放 置 在 其 父 组 件 (窗口 本 喘 ) 的 顶部 中 心 位 置 


表 9-1 列举 了 tkinter 组 件 选项 ， 其 中 ，text 参数 只 是 定义 组 件 外 观 的 若干 可 选 组 
件 构 造 函 数 参数 之 一 。 我 们 将 在 接 下 来 的 三 个 GUI 实例 中 展示 其 他 一 些 选项 。 
表 9-1 tkinter 组 件 选 项 ， 可 以 用 于 指定 组 件 的 外 观 。 选 项 的 值 作 为 组 件 构造 函数 的 输入 参数 
传递 。 这 些 选 项 可 以 用 于 指定 所 有 tkinter 组 件 的 外 观 ， 而 不 仅仅 适用 于 组 件 Label。 
表 中 选项 的 使 用 方法 贯穿 本 节 
选 项 说 明 
text 要 显示 的 文本 
image 要 显示 的 图 像 
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( 续 ) 
选 项 说 明 
i 组 件 的 宽度 ， 单 位 为 像素 (对 于 图 像 而 言 ) 或 字符 数 (对 于 文本 而 言 )。 如 果 省 略 ， 则 根 
据 内 容 自 动 计 算 大 小 
de 组 件 的 高 度 ， 单 位 为 像素 (对 于 图 像 而 言 ) 或 字符 数 (对 于 文本 而 言 )。 如 果 省 略 ， 根 据 
到 内 容 自动 计算 大 小 
ee 边框 样式 。 选 项 包括 : FLAT (默认 )、GROOVE、RAISED、RIDGE 和 SUNKEN， 它 们 都 


定义 在 tkinter 中 


borderwidth 边框 宽度 ， 默 认为 0 (无 边框 ) 


background 背景 颜色 名 称 (字符 串 ) 
foreground 前 景 颜色 名 称 (字符 串 ) 
Font 字体 描述 符 ( 作 为 元 组 ， 包 括 字 体 名 称 、 字 体 大 小 、 以 及 可 选 的 字体 样式 ) 
padx, pady 在 x 轴 或 y 轴 上 添加 到 组 件 上 的 填充 
9.1.3 ”显示 图 像 


Label 组 件 可 以 显示 的 内 容 不 仅仅 是 文本 。 为 了 显示 图 像 ， 在 Label 构造 图 数 中 ， 应 
该 使 用 一 个 名 为 Image 的 参数 ， 而 不 是 text 参数 。 下 一 个 示例 程序 将 一 个 GIF 图 像 放 
置 在 GUI 窗口 中 。( 本 例 使 用 文件 peace.gif， 应 该 和 模块 peace.py 放置 在 同一 文件 


次 中 


模块 : peace.py 


from tkinter import Tk, Label, Photolmage 
root = Tk() # 窗口 

# 将 GIF 格式 转换 为 tkinter 可 以 显示 的 格式 
photo = PhotolImage(file='peace .gif') 


peace = Label (master=root, 
image=photo, 
width=300， # 标签 宽 
height=180) # 标签 高 

peace.pack() 

root .mainloop() 


度 ( 以 像素 为 单位 ) 
度 ( 以 像素 为 单位 ) 


生成 的 GUI 如 图 9-3 所 示 。 构 造 哨 数 的 参数 image 必须 指向 一 个 tkinter 能 够 显示 
的 图 像 格式 的 图 像 。 定 义 在 模块 tkinter 中 的 PhotoImage 类 ， 可 以 用 于 把 一 个 GIF 图 
像 转换 为 此 类 格式 的 对 象 。 参 数 width 和 height 指定 Label 的 宽度 和 高 度 ， 以 像素 为 


单位 。 


图 9-3 一 个 图 像 标 签 。 使 用 image 参数 ， 一 个 Label 组 件 可 以 显示 一 幅 图 像 。 选 项 width 


和 height 指定 标签 的 宽度 和 高 度 ， 单 位 为 像素 。 如 果 图 像 比 标签 小 ， 则 四 周 填充 白色 
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知识 拓展 : GIF 和 其 他 图 像 格式 

GIF 只 是 定义 的 许多 图 像 文件 格式 中 的 一 种 。 你 可 能 熟悉 JPEG ( Joint Photographic 
Experts Group ) 格式 ,主要 用 于 照片 。 其 他 常用 的 图 像 格式 包括 位 图 BMP (Bitmap Image 
File)、 PDF (Portable Document Format) 和 TIFF (Tagged Image File Format ) 。 

如 果 要 显示 GIF 格式 以 外 的 图 像 ， 可 以 使 用 Python 图 像 库 (PIL, Python Imaging 
Library)。 它 包含 各 种 类 ， 可 以 载 入 30 种 以 上 格式 的 图 像 并 将 其 转换 为 tkinter 兼容 的 
图 像 对 象 。PIL 还 包含 用 于 图 像 处 理 的 工具 。 要 了 和 解 更 多 信息 ， 请 访问 网 站 : 

www.pythonware.com/products/pil/ 


注意 : 编写 本 书 时 ，PIL 还 没有 升级 到 支持 Python 3。 


9.1.4 布局 组 件 


tkinter 几何 管理 需 负 责 管理 组 件 在 其 父 组 件 中 的 位 置 。 如 果 必 须 放 置 多 个 组 件 ， 布 

站 人 理 需 使 用 复杂 的 布局 算法 〈 试 图 确保 布局 良好 ) 和 程序 员 给 出 的 指令 计算 。 包 
个 或 多 个 子 组 件 的 父 组 件 的 大 小 由 子 组 件 的 大 小 和 位 置 决定 。 此 外 ， 随 着 用 户 调整 GUI] 

i 其 大 小 和 布局 也 随 之 动态 改变 。 

方法 pack() 是 可 以 用 来 提供 指令 给 几何 管理 右 的 三 种 方法 之 一 。( 本 节 稍 后 将 涉及 男 
一 个 方法 gria( ) 。) 指令 指定 子 组 件 在 其 父 组 件 中 的 相对 位 置 。 

为 了 演示 如 何 使 用 指令 以 及 说 明 如 何 使 用 组 件 的 其 他 构造 晒 数 选项 ， 我 们 开发 了 一 个 
UI， 包 括 两 个 图 像 标 签 和 一 个 文本 标签 ， 如 图 9-4 所 示 。 





Peace begins with a smiie. 


图 9-4 多 组 件 GUI， 三 个 Label 组 件 布局 在 GUI 窗口 。 和 平 (peace) 图 像 位 于 左 侧 ， 笑 脸 
(smiley face) 图 像 位 于 右 侧 ， 而 文本 位 于 下 方 


方法 pack( ) 的 可 选 参 数 side 用 于 指示 tkinter 几何 管理 器 把 组 件 放置 到 其 父 组 件 
的 特定 边缘 。side 的 值 包 括 : TOP、BOTTOM、LEFT 和 RIGHT， 它 们 是 定义 在 tkinter 
模块 中 的 常量， 默认 值 是 TOP。 在 实现 上 述 GUI 的 过 程 中 ， 我 们 使 用 side 选项 来 布局 三 
个 组 件 : 


模块 : smileyPeace.py 


from tkinter import Tk,Label,Photolmage,BOTTOM,LEFT,RIGHT,RIDGE 
2s ## GUI 展示 了 组 件 构 造 函 数 选项 和 方法 Pack() 
; root = Tk() 


# 带 有 文本 信息 “和 和 平 ， 从 一 个 微笑 开始 ”的 标签 

text = Label(root， 
font = ('Helvetica', 16, 'bolad italic+y) ， 
foreground='white'， # 文字 颜色 
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background='black '， # 背景 颜色 
Padx=25， # 标签 左 和 右 均 扩展 25 像素 
pady=10， # 标签 上 和 下 均 扩展 25 像素 
text='Peace begins with a smile.') 
text .pack(side=BOTTOM) # 文本 标签 放置 于 下 方 


# 带 有 一 个 和 平 符号 图 像 的 标签 
is peace = PhotoImage(file='peace.gif') 
i+ peaceLabel = Label (root, 

18 borderwidth=3， # 设置 标签 边框 宽度 
relief=RIDGE， # 设置 标签 边框 样式 
image=peace) 
peaceLabel .pack (side=LEFT) # 和 平 图 像 放 置 于 左 便 

# 带 有 一 个 笑脸 图 像 的 标签 
smiley = PhotoImage(file='smiley.gif') 
smileyLabel = Label (root, 
image=smiley) 
smileyLabel .pack(side=RIGHT) # 笑脸 图 像 放置 于 右 侧 


root .mainloop() 

表 9-2 列 出 pack( ) 方法 的 另外 两 种 选项 。 选 项 expand 可 以 设置 为 True 或 False， 
指定 是 否 允 许 扩展 组 件 以 填充 父 组 件 中 的 任何 额外 空间 。 如 果 选 项 扩展 设置 为 True， 可 以 
使 用 选项 £i11 来 指定 扩展 是 否 应 该 沿 x 轴 、y 轴 或 两 者 进行 填充 。 

表 9-2 布局 选项 。 除 了 选项 side， 方法 pack( ) 还 可 以 带 选 项 fill 和 expand 


选 项 说 明 
指定 组 件 停 靠 的 边 (使 用 tkinter 中 定义 的 常量 TOP、BOTTOM、LEFT 和 RIGHT)， 默 
side ke 
认 值 为 TOP 
本 指定 组 件 是 否 应 该 填充 其 父 组 件 所 定义 的 空间 的 宽度 或 高 度 。 选 项 包括 “ both”、“ x”、 


“y” 和 “none” (默认 )。 
expand 指定 组 件 是 否 应 该 扩展 以 填充 给 定 的 空间 ， 默 认为 false (不 扩展 ) 


GUI 程序 smileypeace.py 还 展示 了 一 些 其 他 未 涉及 的 组 件 构 造 咖 数 选 项 。 使 用 选项 
borderwidth 和 relief， 指 定 和 平 符号 (peace) 的 边框 宽度 为 3， 边 框 样式 为 RIDGE 
(隆起 )。 同 时 ， 文 本 标签 ( 特 丽 莎 修女 的 一 句 名 言 ) 的 构造 也 使 用 了 选项 指定 白色 字体 ( 选 
项 foreground)、 黑 色 背 景 (选项 background)、 上 下 10 像素 的 填充 (选项 pady)、 左 
右 25 像素 的 填充 (选项 padx)。font 选项 指定 的 文本 的 字体 为 : 加 粗 、 斜 体 、 大 小 为 16 
点 的 Helvetica 字体 。 


上 编写 程序 peaceandlove .py, 创建 如 下 GUI: 


了 tk #3 
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要 求 “ Peace&Love” 文 本 标签 停靠 左 侧 ， 墨 色 背 景 ,. 大 小 为 S 行 (足以 放置 20 个 字 
符 )。 如 果 用 户 扩展 窗口 ， 要 求 标 签 保 持 停靠 窗口 左 侧 边框 。 和 平 待 号 (peace) 图 像 标 签 停 
徘 右 侧 。 然 而 ， 如 果 用 户 扩 展 窗 口 ， 右 侧 使 用 白色 填充 。 示 意图 显示 了 用 户 手 动 扩 展 窗口 后 
的 结果 图 。 


注意 事项 : 忘记 几何 规范 
忘记 指定 组 件 的 位 置 是 一 个 常见 的 错误 。 仅 当 在 其 父 组 件 中 布局 之 后 ,一 个 组 件 才 
会 出 现在 GUI 窗口 中 。 其 实现 可 以 通过 调用 组 件 的 方法 pack()、 方 法 grid())( 稍 后 讨 
论 )， 或 方法 place() (本 书 没有 讨论 )。 


9.1.5 ”将 组 件 布 局 为 表格 
接 下 来 讨论 图 中 包括 若干 标签 的 GUI。 如 何 开 发 如 图 9-5 所 示 的 电话 拨号 盘 GUI ? 


Yk 
L 
和 
71819 
0 4 


图 9-5 电话 拨号 盘 GUI。 这 个 GUI 的 标签 保存 在 一 个 4x3 网 格 中 。 相 对 于 方法 pack(), 方 
法 grid() 更 适合 于 把 组 件 放置 在 网 格 上 。 行 从 上 到 下 索引 ， 列 从 左 到 右 索 引 ， 索 引 
均 从 0 开始 


我 们 已 经 知道 如 何 使 用 Label 组 件 来 创建 每 个 单独 的 电话 拨号 “按钮 ” 。 但 尚 不 清楚 
如 何 把 12 个 “按钮 ”排列 在 一 个 网 格 中 。 

如 果 我 们 需要 将 几 个 组 件 布局 为 一 个 网 状 风 格 ， 方法 grid() 比方 法 pack() 更 合适 。 
使 用 方法 grid() 时 ， 父 组 件 被 分 为 行 和 列 ， 所 得 到 的 网 格 的 每 个 单元 格 可 以 存储 一 个 组 
件 。 要 把 一 个 组 件 放置 到 第 工行 第 c 列 ， 可 以 调用 方法 grid()， 使 用 行 和 列 c 作为 输 
入 参数 ， 如 下 列 电话 拨号 盘 GUI 的 实现 所 示 : 


模块 : phone.py 
! from tkinter import Tk, Label, RAISED 


az Toot = Tk() 
”Tl TE 2 “1, # 电话 拨号 标签 文本 
0 # 布局 为 网 格 
Ry 
['*' Xo #']] 
s for r in range(4): # 对 于 每 个 行 r = 0，1，2，3 
for & 3h wangel3) # 对 于 每 个 列 c = 0，1，2 
# 为 工行 c 列 创建 标签 
label = Label (root, 
relief=RAISED, # 设置 边框 样式 
13 padx=10, # 加 宽 标 签 


text=labels[r] [c]) # 标签 文本 


label.grid(row=r，column=cy) 


root .mainloop() 


在 第 5 行 到 第 8 行 中 ， 我们 定义 了 一 个 二 维 列 表 ， 存 储 将 放置 在 电话 拨号 盘 的 r 行 c 
列 的 标签 的 文本 。 这 样 做 有 助 于 在 第 10 行 到 第 19 行 中 散 套 for 循环 以 创建 并 放置 标签 
注意 使 用 方法 grid() 时 ， 将 行 和 列 作为 输入 参数 。 

表 9-3 显示 了 grid( 方法 的 一 些 选 项 。 


表 9-3 grid() 方法 选项 。columnspan 选项 用 于 把 组 件 跨 多 个 列 放 置 ， rowspan 选项 


用 于 把 组 件 跨 多 个 行 放置 。 

选 项 说 明 
column 指定 组 件 的 列 ， 默 认 值 为 0 
columnspan 指定 组 件 占 用 多 少 列 
row 指定 组 件 的 行 ， 默认 值 为 0 
rowspan 


# 定 组 件 占 用 多 少 行 


注意 事项 : 混合 使 用 pack() 和 grid() 
方法 pack() 和 grid() 使 用 不 同 的 方法 来 计算 组 件 的 布局 。 这 两 种 方法 不 能 很 好 
地 结合 在 一 起 ， 每 个 方法 都 会 党 试 以 自己 的 方式 优化 布局 ， 并 试图 取消 其 他 算法 的 选择 。 
结果 是 程序 可 能 永远 无 法 完成 执行 。 


因此 结论 就 是 : 对 于 位 于 同一 个 父 组 件 中 的 所 有 组 件 ， 我 们 必须 只 能 选择 使 用 其 中 一 
种 布局 方式 ， 不 能 使 用 混合 布局 方法 。 


实现 马 数 cal()， 带 两 个 输入 参数 : 年 和 月 (1 到 2 之 间 的 一 个 数 )。 启 
动 一 个 GUI， 显 示 对 应 的 日 历 。 例如， 图 示 日 历 通 过 执行 命令 获得 : 


>3> TalL(2012, 2) 


-人 季 


Mon Tue Wed Thyu Fr Sat Sun 


1 7 


2 ”3 16 17 18 19 
RO 
27 28 2 


要 实现 该 功能 ， 用 户 需 要 计算 : (1) 指定 月 份 的 第 一 天 对 应 的 星期 (星期 一 、 星 期 


、… )。( 2 ) 指定 月 份 的 天 数 (考虑 头 年 )。 模 块 calendar 中 定义 的 函数 monthrange() 
恰好 返回 这 两 个 值 : 


-一 


=D 


>>> from calendar import monthrange 
>>> monthrange(2012，2) 


# year 2012, month 2 (February) 
(2， 29) 


返回 值 是 一 个 元 组 。 元 组 的 第 一 个 值 是 2， 对 应 于 星期 三 (Wednesday)( 星 期 一 是 0， 星 
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期 二 是 1， 以 此 类 推 )。 元 组 的 第 二 个 值 是 29， 这 是 2012 年 2 月 份 的 天 数 〈 国 年 )。 


知识 拓展 : 你 想 了 解 更 多 吗 ? 
本 章 只 是 使 用 tkinter 进行 GUI 开 发 的 入 门 介绍 。 关 于 GUI 开 发 和 tkinter 
GUI 的 全 面 介 绍 需要 整 本 教材 的 篇 幅 。 如 果 你 想 了 解 更 多 内 容 ， 请 从 Python 文档 开始 ， 
http://docs.python.org/py3k/library/tkinter.html 
两 个 特别 有 用 的 资源 (尽管 它们 使 用 Python 2 ) 的 网 址 为 : 
http://www.pythonware.com/library/tkinter/introduction/ 
http://infohost.nmt.edu/tcc/help/pubs/tkinter/ 


9.2 基于 事件 的 tkinter 组 件 


接 下 来 我 们 探讨 tkinter 提供 的 不 同类 型 的 组 件 。 特 别 地 ， 我 们 研究 啊 应 用 户 鼠 标 或 
者 键盘 输入 的 那些 组 件 。 这 些 组 件 具 有 交互 行为 ， 必 须 采 用 基于 事件 驱动 的 程序 开发 风格 。 
除了 GUI 开 发， 事件 驱动 程序 还 用 于 计算 机 游戏 和 分 布 式 客户 端 / 服务 如 等 应 用 程序 的 开 


9.2.1 Button 组 件 及 事件 处 理 程序 
我 们 首先 从 经 典 的 按钮 组 件 开 始 讨论 。 模 块 tkinter 中 的 类 Button 表示 GUI 按钮 。 
为 了 描述 其 用 法 ,我 们 开发 了 一 个 简单 的 仅 包 含 一 个 按钮 的 GUI 应 用 程序 ， 如 图 9-6 所 示 。 
ET OA tk 


Click it 


图 9-6 包含 一 个 Button 组 件 的 GUI。 按 钮 上 显示 文本 “click it”。 当 单 击 该 按钮 时 ， 
输出 日 期 和 时 间 信 息 


该 应 用 程序 的 工作 方式 为 : 当 用 户 单 击 按 钮 “ClLick it” 时 ,在 解释 器 命令 行 中 输出 
单 击 按钮 时 的 日 期 和 时 间 信 息 : 

>>> 

Day: 07 Jul 2011 

Time: 23:42:47 PM 

如 果 你 愿意 ， 你 可 以 不 断 重 复 单 击 该 按钮 : 

> 


Day: 007 Jul 20141 
Time: 23:42:47 PM 


Day: WE Jil 2011 
Time: 23:42:50 PM 


让 我 们 来 实现 这 个 GUI。 要 构建 一 个 按钮 组 件 ， 我 们 使 用 Button 构造 函数 。 和 
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Label 构造 限 数 一 样 ，Button 构造 也 数 的 第 一 个 参数 必须 指向 按钮 的 父 组 件 。 要 指定 按 
钮 上 显示 的 文本 ， 可 以 使 用 text 参数 ， 这 也 和 Label 组 件 一 样 。 事 实 上 ， 表 9-1 中 显示 
的 所 有 定制 组 件 的 选项 同样 也 可 以 用 于 Button 组 件 。 

按钮 组 件 和 标签 组 件 的 一 个 区 别 在 于 ， 按 钮 是 交互 式 组 件 。 每 次 单 击 一 个 按钮 时 ， 会 执 
行 某 个 操作 。 事 实 上 ,“ 操 作 ” 实 现 为 一 个 函数 ， 每 次 单 击 按钮 时 会 被 执行 。 我 们 可 以 通过 
Button 构造 子 数 中 的 command 选项 指定 该 男 数 的 名 称 。 下 面 是 为 上 述 GUI 创建 按钮 组 件 
的 方法 : 

root = Tk() 

button = Button(root, text='Click it', command=clicked) 


当 单 击 按钮 时 ， 将 执行 浮 数 clicked()。 接 下 来 需要 实现 该 阴 数 。 当 调用 该 阴 数 时 ， 
要 求 困 数 输 出 当前 日 期 和 时 间 信 息 。 我 们 使 用 4.2 节 中 的 模块 time 来 获取 和 输出 当前 本 地 
时 间 。 因 此 完整 的 GUI 程序 代码 如 下 : 


模块 : clickit.py 


1 from tkinter import Tk, Button 
from time import strftime, localtime 


4 def clicked(): 
' 打印 日 期 和 时 间 信 息 ，' 
time = strftime('Day: %d yb %Y\nTime: %H:%M:%S %p\n', 
localtime()) 
print (time) 


16 TOOt = Tk() 


# 创建 标 有 '， Click it ' 文字 的 按钮 以 及 clicked 事件 处 理 函数 

button = Button(root, 

text='Click it ， # 按钮 上 显示 的 文字 信息 

15 command=clicked)  # 按钮 单 击 事件 处 理 程序 

is button.pack() 
root .mainloop() 


国 数 clicked() 被 称 为 事件 处 理 程序 ， 它 处 理 单 击 按钮 “click it” 时 产生 的 
事件 。 

在 clicked() 的 第 一 个 版 本 实现 中 ,日 斯 和 时 间 信 息 输出 到 命令 行 。 假 设 我 们 希望 输 
出 信息 到 一 个 小 的 GUI 窗口 中 ， 如 图 9-7 所 示 。 


Day: 08 Jul 2011 


| Time: 12:47:48 PM 
ww 
-一 
图 9-7 showinfo() 窗口 。 模 块 tkinter .messagebox 中 的 showinfo() 轴 数 在 一 个 独 
立 的 窗口 中 显示 消息 。 单 击 “OK” 按 钮 ， 可 以 关 财 该 窗口 


在 模块 tkinter .messagebox 中 ,包含 一 个 曙 数 showinfo()， 可 以 在 一 个 独立 的 
窗口 中 显示 一 个 字符 串 。 因 此 ， 我们 只 需要 把 原始 的 函数 cl1icked ( ) 替换 为 : 
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模块 : clickit.py 


' from tkinter.messagebox import showinfo 


3 def clicked(): 
' 打印 日 期 和 时 间 信 息 ， 
time = strftime('Day: %d %b YXYNnTime: %H:%M:%S %p\n', 
localtime()) 
showinfo(message=time) 


实现 一 个 GUI， 要 求 包含 两 个 标 有 文字 “Local time” 和 “Greenwich 
time” 的 按钮 。 单 击 第 一 个 按钮 时 ， 在 命令 行 输出 本 地 时 间 。 单 击 第 二 个 按钮 时 ， 要 求 输 
出 格林 尼 治 时 间 。 


>>> 

Local time 

Day: 08 Jul 2011 
Time: 13:19:43 PM 


Greenwich time 
Day: 08 Jul 2011 
Time: 18:19:46 PM 


使 用 模块 time 中 的 gmtime() 函数 可 以 获得 当前 格林 尼 治 标准 时 间 。 


9.2.2 事件、 事件 处 理 程序 和 mainloop() 


了 解 了 交互 式 Button 按钮 的 工作 方式 之 后 ， 接 下 来 解释 GUI 如 何 处 理 用 户 生 成 的 事 
件 (例如 ， 单 击 按钮 )。 当 调用 mainloop() 方法 启动 GUI 时 ，Python 开始 一 个 被 称 为 事 
件 循 环 的 无 限 循环 。 事 件 循环 可 以 很 好 地 使 用 下 面 的 伪 代 码 表示 : 
while True: 
等 待 一 个 事件 发 生 
运行 相关 联 的 事件 处 理 函 数 
换言之 ,在 任何 时 间 点 ，GUI 都 在 等 待 事件 。 当 发 生 了 一 个 事件 (例如 ， 单 击 按钮 )， 
GUI 执行 指定 的 函数 来 处 理 该 事件 。 当 事件 处 理 也 数 终止 后 ，GUI 返回 并 继续 等 待 下 一 个 
事件 。 
单 击 按钮 仅仅 是 GUI 中 可 能 发 生 的 事件 的 一 种 。 鼠 标 移动 或 者 在 输入 域 按 下 键盘 上 的 
按键 也 会 产生 事件 ， 可 以 被 GUI 处 理 。 本 节 稍 后 我 们 将 讨论 这 种 示例 。 


知识 拓展 : GUI1 简 史 

第 一 个 带 图 形 界 面 的 计算 机 系统 是 Xerox Alto 计算 机 ， 由 Xerox PARC 的 研究 人 员 
( Palo Alto 研究 中 心 ) 于 1973 年 在 帕 洛 阿尔 托 ( 加 利 福 尼 亚 ) 开发 。Xerox PARC 于 1970 
年 成 立 ， 作 为 施乐 公司 研发 分 部 ， 除 了 负责 开发 图 形 用 户 界面 ， 还 负责 开发 许多 现在 常见 
的 计算 机 技术 ,例如 激光 打印 、 以 太 网 和 现代 个 人 电脑 等 。 

施乐 Alto 图 形 用 户 界 面 的 灵感 来 源 于 位 于 门 洛 帕克 (加 利 福 尼 亚 ) 的 国际 斯 坦 福 研 
究 院 、 以 鼠标 之 父 道 格拉 斯 . 思 格 尔 巴 特 (Douglas Engelbart) 为 首 的 研究 者 开发 的 可 以 
使 用 鼠标 点 击 基于 文本 的 超 链接 的 在 线 系统 。 施 乐 Alto 图 形 用 户 界 面包 含 很 多 图 形 元 素 ， 


如 窗口 、 菜 单 、 单 选 按钮 、 复 选 框 、 图 标 ， 均 可 以 使 用 鼠标 和 键盘 进行 操作 。 

1979， 苹 果 电 脑 的 创始 人 史 蒂 夫 乔布斯 参观 了 施乐 PARC， 在 那里 学 到 了 施乐 Alto 
的 通过 鼠标 控制 的 图 形 用 户 界 面 。 他 很 快 把 它 集 成 到 苹果 计算 机 系统 中 ，1983 年 首先 集 
成 到 Apple Lisa 中 ， 然 后 在 1984 年 集成 到 Macintosh 中 。 从 那 以 后 ， 所 有 主流 的 操作 系 
统 都 支持 图 形 用 户 界 面 。 


9.2.3 Entry 组件 

在 下 一 个 GUI 示例 中 ,我 们 引入 了 Entry 组 件 类 。 它 表示 表单 中 常见 的 典型 的 单行 文 
本 框 。 我 们 要 构建 的 GUI 应 用 程序 要 求 用 户 输入 一 个 日 期 ， 然 后 计算 与 之 对 应 的 星期 。 要 
求 GUI 界面 如 图 9-8 所 示 。 


'* tk 
tnter date 


tnter 
图 9-8 星期 应 用 程序 。 应 用 程序 要 求 用 户 输入 一 个 日 期 格式 为 MMM DD,YYYY (例如 ，Jan 21, 1967 ) 


当 用 户 在 输入 框 中 键入 : Jan 21, 1967， 并 单 击 【 Enter 】 按 钮 后 ， 弹 出 一 个 新 窗口 ， 如 
图 9-9 所 示 。 


jan 21, 1967 was a Saturday 


图 9-9 星期 应 用 程序 的 弹出 窗口 。 当 用 户 输入 日 期 并 单 击 【 Enter 】 按 钮 后 ， 在 弹出 窗口 中 显 
示 该 日 期 对 应 的 星期 


很 显然 ，GUI 包含 一 个 Label 和 一 个 Button 组 件 。 文 本 输入 框 则 需要 使 用 定义 在 
tkinter 中 的 Entry 组 件 。Entry 组 件 适 合 于 输入 (并 显示 ) 单行 文本 。 用 户 可 以 在 该 组 
件 中 使 用 键盘 键入 文本 。 接 下 来 我 们 开始 实现 该 GUI: 


模块 : day.py 


1 # import 导入 语句 以 及 
: # 计算 和 显示 星期 的 事件 处 理 函 数 compute( ) 


i ‘E00t: = TEC) 


5 # label 标签 

; label = Label(root, text='Enter date') 
s label.grid(row=0, column=0) 

3 # 
0 # entry 输入 杠 

1 dateEnt = Entry(root) 
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dateEnt .grid(row=0, column=1) 


# button 按钮 
button = Button(root, text='Enter', command=compute) 
button.grid(row=1, column=0, columnspan=2) 


root .mainloop() 


在 第 13 行 ， 我们 创建 了 一 个 Entry 组 件 。 注 意 我 们 使 用 了 方法 gria( ) 布局 三 个 组 
件 。 剩 余 的 工作 是 实现 事件 处 理 滑 数 compute( ) 。 让 我 们 先 描述 该 图 数 的 功能 : 
1. 从 输入 框 dateEnt 中 读 取 日 期 ; 
2. 计算 对 应 该 日 期 的 星期 ; 
3. 在 弹出 窗口 中 显示 星期 信息 ; 
4. 清空 输入 框 dateEnt 中 的 内 容 。 
最 后 一 步 是 一 个 不 错 的 选择 : 我 们 清空 刚刚 键入 的 内 容 ， 以 方便 继续 输入 新 的 日 期 。 
为 了 读 取 一 个 Entry 组 件 中 的 字符 串 内 容 ， 可 以 使 用 Entry 方 法 get()。 它 
返回 输入 框 中 的 文本 。 要 清空 一 个 Entry 组 件 中 的 字符 串 ， 我们 需要 使 用 Entry 方 
法 delete()。 一 般 而 言 delete() 方 法 用 于 删除 Entry 组 件 中 的 子 字 符 品 。 因 此 
delete( ) 市 两 个 参数 . 索引 first 和 索引 Last， 删 除 从 索引 first 开始 到 索引 last 
之 前 的 子 字 符 串 。 索 引 0 和 END (tkinter 中 定义 的 常量 ) 可 以 用 于 删除 一 个 输入 框 中 的 
所 有 字符 串 。 表 9-4 显示 了 其 他 Entry 方法 的 用 法 。 
表 9-4 一 些 Entry 方 法 。 其 中 列举 了 类 Entry 的 三 个 核心 方法 。 常 量 END 定义 在 
tkinter 中 ， 指 向 输入 框 中 最 后 一 个 文本 之 后 的 索引 位 置 
选 项 说 有 明 
e.get() 返回 输入 框 e 中 的 字符 串 
把 text 插入 到 输入 框 e 的 给 定 索引 位 置 indaex。 如 果 index 是 END， 则 添加 
字符 串 到 后 面 
删除 输入 框 e 的 从 索引 from (包含 ) 到 索引 to (不 包含 ) 的 子 字 符 串 。 
delete(0，END) 删除 输入 框 中 的 所 有 文本 


e.insert(index, text) 


e.delete(from, to) 


基于 Entry 组 件 类 的 方法 ,我们 现在 可 以 实现 事件 处 理 浮 数 compute{ ) : 


模块 : day.py 


from tkinter Import Tk, Button, Entry, Label, END 
from time import strptime, strftime 
from tkinter.messagebox import showinfo 


def compute() : 
' 显示 指定 日 期 格式 dateEnt 所 对 应 的 星期 ， 
日 期 格式 必须 为 : MMM DD ，YYYY (例如 ，UJan 21，1967) '… 


global dateEnt  # dateEnt 是 一 个 全 局 变量 


# 从 输入 框 dateEnt 中 读 取 日 期 
date = dateEnt .get() 


14 # 计算 日 期 相对 应 的 星期 
‘5 weekday = strftime('%A', strptime(date, '%b %d, %Y')) 


# 在 弹出 式 窗口 中 显示 星期 


18 showinfo(message = '{} was a {}'.format(date, weekday)) 


20 # 从 输入 框 dateEnt 中 删除 日 期 
21 dateEnt .delete(0，END) 


23 # 程序 的 剩余 部 分 


在 第 9 行 ， 我 们 指定 dateEnt 是 一 as 虽然 不 是 严格 必须 (在 函数 
compute( ) 中 ， 我 们 没有 赋值 给 dateEnt),， 但 它 是 一 个 警告 ， 维 护 代 码 的 程序 员 会 意识 
到 dateEnt 不 是 一 个 局 部 变量 。 

在 第 15 行 ,我 们 使 用 模块 time 中 的 两 个 图 数 来 计算 对 应 一 个 日 期 的 星期 。 困 数 
strptime() 带 两 个 参数 : 一 个 包含 日 期 (date) 的 字符 串 、 一 个 格式 化 字符 串 (' sb sd， 
%Y' ， 使 用 表 4-3 中 的 指令 )。 图 数 strptime() 返回 一 个 类 型 为 time .struct time 的 
日 期 对 象 。 请 回顾 4.2 节 中 的 困 数 stzftime( )， 带 该 类 型 的 日 期 对 象 参数 和 一 个 格式 化 
字符 串 参数 (' $A' )， 并 返回 基于 格式 化 字符 串 的 日 期 。 由 于 格式 化 字符 串 仅仅 包括 指令 $A 
(指定 星期 )， 因 此 仅 返 回 星期 。 


实现 GUI 程序 的 一 个 修改 版 本 : day2.Py。 替 代 在 单独 的 弹出 窗口 显示 
玫 六 入 是 。 在 输入 框 的 前 面 插入 星期 信息 ， 如 图 所 示 。 另 外 ， 添 加 一 个 标 有 【 Clear 】 文 字 
的 按钮 ， 用 于 删除 输入 框 中 的 内 容 。 


nA Ar tk : 
Enter date | Saturday Jan 21, 1967| 


Enter Clear 


9.2.4 Text er 


接 下 来 我 们 介绍 Text 组 件 。Text 组 件 用 于 交互 式 输 入 多 行文 本 ， 这 和 在 一 个 文本 编 
辑 益 中 输 hh Text 组 件 类 同样 支持 类 Entry 文 持 的 方法 get()、insert() 和 
delete(), 但 格式 不 尽 相 同 (参见 表 9-5 )。 
表 9-5 一 些 Text 方 法。 与 Entry 方法 中 使 用 的 索引 不 同 ，Text 方法 中 的 索引 的 格式 为 
row.column (例如 ， 索 引 2.3 表示 第 3 行 的 第 4 个 字符 )。 


选 项 说 明 
t.insert(index, text) 把 text 插入 到 Text 组 件 七 中 索引 index 位 置 之 前 
t.get(from, to) 返回 Text 组 件 t 中 从 索引 位 置 from (包含 ) 到 to (不 包含 ) 的 子 字符 串 
t.delete(from，to) 删除 zext 组 件 t 中 从 索引 位 置 from (包含 ) 到 to (不 包含 ) 的 子 字符 串 
yf 弥 
我 们 使 用 一 个 Text 组 件 来 开发 一 Top secret: for your 


eyes only! 


个 外 观 类 似 文本 编辑 器 的 应 用 程序 ， 但 
“ 私 底 下 ”记录 和 输出 用 户 在 Text 组 件 
中 键入 的 任何 按键 。 例 如 ， 假 如 用 户 键 ”图 9-10 按键 记录 器 应 用 程序 。 记 录 按 键 的 GUI 包括 
入 如 图 9-10 所 示 的 句子 。 一 个 Text 组件 。 当 用 户 在 文本 框 中 输入 文 

则 命令 行 中 会 输出 下 列 内 容 : 本 ， 所 有 的 按键 都 会 被 记录 并 在 命令 行 中 输出 
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ehar = Shift L 
char = T 
char = © 
char =p 
char = space 
char = s 
char = e 
char = Cc 
char = r 
char = e 
char = 


(我 们 省 略 了 剩余 的 字符 。) 这 种 程序 通常 被 称 为 按键 记录 器 (keyLogger)。 
接 下 来 我 们 开发 这 个 应 用 程序 。 为 了 创建 大 小 足够 容纳 5 行 20 个 字符 的 Text 组 件 ， 
我 们 使 用 width 和 height 组 件 构造 函数 选项 : 


from tkinter import Text 
t = Text(root, width=20, height=5) 


为 了 记录 用 户 在 Text 组 件 键入 的 每 一 个 按键 ,我 们 需要 把 按键 关联 到 一 个 事件 处 理 也 
数 。 我 们 可 以 使 用 bind( ) 方法 来 实现 ， 其 目的 是 “ 绑 定 ” (或 关联 ) 一 个 事件 类 型 到 一 个 事 
件 处 理 函数 。 例 如 ， 


text.bind('<KeyPress>', record) 


上 述 语 句 把 按键 (使 用 字符 串 '<KeyPress>' 描述 的 事件 类 型 ) 绑 定 到 事件 处 理 函 数 
record( ) 。 

为 了 实现 按键 记录 需 程 序 ， 我 们 需要 了 解 有 关 事 件 模式 和 tkinter Event 类 的 相关 
知识 。 


9.2.5 事件 模式 和 tkinter 类 Event 


一 般 而 言 ，bind( ) 方法 的 第 一 个 参数 是 我 们 要 绑 定 的 事件 的 类 型 。 事 件 的 类 型 是 由 一 
个 字符 串 表 示 的 ， 该 字符 串 是 一 个 或 多 个 事件 模式 的 级 联 。 事 件 模 式 具 有 下 列 格式 : 


<modifier-modifier-type-detail> 


表 9-6 显示 了 modifier、type 和 detail 的 一 些 取 值 。 对 于 我 们 的 按键 记录 器 ， 事 
件 模式 将 仅 包 括 一 个 类 型 KeyPress。 事 件 模 式 及 其 关联 目标 事件 的 示例 如 下 所 示 : 
e <Control-Button-1>: 同时 按 Ctrl 键 和 鼠标 左 键 
e <Button-1><Button-3>: 按 鼠 标 左 键 ， 然 后 按 鼠 标 右键 
e <KeyPress-D><Return>: 按键 盘 D 键 ， 然 后 按键 盘 上 的 【 Enter/Return 】 键 
e <Buttonsl-Motion>: 按 下 鼠标 左 键 并 移动 孔 标 
表 9-6 一 些 事件 模块 modifiers、types 和 details。 一 个 事件 模式 是 一 个 字符 串 ， 由 符 
号 < 和 > 分隔， 依次 可 以 包含 至 多 两 个 modifiers、 一 个 types 和 一 个 detail 
Modifier 说 有明 
Control 【 Ctrl 】 键 
Buttonl 鼠标 左 键 


( 续 ) 
Modifier 说 明 
Button3 鼠标 右键 
Shift 【 Shift ] 键 
Type 
Button 鼠标 按键 
Return [ 回 车 ] 键 
KeyPress 按 下 键盘 上 的 一 个 按键 
KeyRelease 释放 键盘 上 的 一 个 按键 
Motion 鼠标 移动 
Detail 
<button number> 1、2 或 者 3， 分 别 表示 鼠标 左 键 、 中 键 或 者 右键 
<key symbol> 键入 字母 符号 


方法 bind( ) 的 第 二 个 参数 为 事件 处 理 消 数 。 该 事件 处 理 消 数 由 开发 人 员 定 义 ， 正 好 
市 一 个 参数 : 一 个 类 型 Event 的 对 和 象 。 类 Event 定义 在 tkinter 中 。 当 发 生 了 一 个 事件 
(例如 按键 )，Python 解释 紫 将 创建 一 个 与 事件 相关 联 的 类 型 Event 的 对 象 ， 并 调用 事件 处 
理 盟 数 ， 把 Event 对 象 作 为 唯一 的 参数 传递 。 

一 个 Event 对 象 包含 许多 属性 ， 用 于 存储 导致 该 对 象 实例 化 的 事件 的 相关 信息 。 例 
如 ， 对 于 一 个 按键 事件 ，Python 解释 需 将 创建 一 个 Event 对 象 ， 并 把 按 下 的 键 的 符号 和 
(Unicode) 编码 赋值 给 属性 keysym 和 keysym_num。 

因此 ， 在 我 们 的 keyLogger 应 用 程序 中 ， 事 件 处 理 果 数 record( ) 应 该 市 一 个 输入 
参数 : Event 对 象 ， 读 取 存 储 在 Event 对 象 中 的 键 符 号 和 编码 ， 并 把 它们 显示 在 命令 行 中 . 
结果 将 达到 预期 的 行为 : 持续 显示 GUI 用 户 键入 的 按键 信息 。 

模块 : keyLogger.py 
from tkinter import Tk, Text, BOTH 
def record(event): 
' 按键 事件 的 处 理 函 数 ， 
输入 事件 是 tkinter.Event 类 型 ''， 
print('char = {}'.format(event .keysym)) # 打印 按键 符号 
s root = Tk() 

0 text = Text(root, 

11 width=20， # 设置 字符 宽度 为 20 
height=5) # 设置 字符 高 度 为 5 行 


# 将 按键 事件 与 事件 处 理 函 数 record( ) 绑 定 


text.bind('<KeyPress>', record) 


7 # 组 件 随 着 父 窗口 扩展 
a text.pack(expand=True, fill=BOTH) 


root .mainloop() 


根据 事件 类 型 ， 解 释 需 会 设置 其 他 Event 对 象 属性 。 表 9-7 显示 了 其 中 一 些 属性 。 表 
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中 还 显示 了 导致 每 个 属性 被 定义 的 事件 类 型 。 例 如 ， 一 个 ButtonPress 事件 将 定义 num 
属性 ， 但 一 个 KeyPress 或 者 KeyRelease 事件 则 不 会 。 
表 9-7 ”一 些 事件 模块 modifiers、types 和 details。 其 中 显示 了 类 Event 的 少数 一 
些 属性 。 同 时 也 显示 了 产生 该 属性 的 事件 。 例 如 ， 所 有 的 事件 都 会 设置 time 属性 


属 性 事件 类 型 说 明 


num ButtonPress 、ButtonRelease 按 下 的 鼠标 键 (1、2、3， 分 别 表 示 左 、 中 、 右 ) 
time 全 部 事件 发 生 的 时 间 


x 全 部 鼠标 的 x 坐标 
y 全 部 鼠标 的 y 坐标 
i 条 
Keysym num 按键 的 Unicode 编码 


有 ” 在 原始 的 day .py 程序 中 ， 在 输入 框 中 键入 日 期 后 ， 用 户 必 须 单 击 按钮 
“Enter”。 要 求 用 己 使 用 键盘 键入 内 容 后 再 使 用 鼠标 不 是 太 方便 。 请 修改 程序 day.py， 允 
许 用 户 仅 通过 按键 盘 上 [【 回 车 】 键 来 代替 和 鼠标 单 击 按钮 “Enter”。 


注意 事项 : 事件 处 理 函 数 
tkinter 中 包含 两 种 不 同类 型 的 事件 处 理 函数 。 例 如 ， 函 数 buttonHandlezr( ) 
就 是 -- 个 按钮 Button 组 件 单 击 事件 的 处 理 函 数 : 


Button(root, text='example', command=buttonHandler) 


定义 函数 buttonhandler( ) 不 能 带 任何 输入 参数 。 
函数 eventHandler() 可 以 按 如 下 方式 处 理 一 个 事件 类 型 : 


widget.bind('<event type>', eventHandler) 


号 数 eventHandler() 的 定义 中 必须 带 唯一 一 个 输入 参数 ， 其 类 型 为 Event。 


9.3 设计 图 形 用 户 界 面 


在 本 节 中 ， 我 们 继续 介绍 新 的 交互 组 件 类 型 。 我 们 将 讨论 如 何 设计 图 形 用 户 界面 ， 跟 踪 
一 些 被 事件 处 理 函 数 读 取 或 修改 的 值 。 我 们 还 将 说 明 如 何以 层次 结构 方式 设计 包含 多 个 组 件 
的 图 形 用 户 界面 。 


9.3.1 组 件 Canvas 


canvas (画布 ) 组 件 是 一 个 有 趣 的 组 件 ， 可 以 显示 包含 直线 和 几何 对 象 的 绘图 。 可 以 
认为 它 是 海 包 绘 图 的 原始 版 本 。( 事 实 上 ， 海龟 绘图 本 质 是 就 是 一 个 tkinter GUI。 ) 

我 们 通过 构建 一 个 非常 简单 的 画笔 绘图 应 用 程序 来 演示 canvas 组 件 。 应 用 程序 由 一 
个 最 初 为 空 的 画布 构成 。 用 户 可 以 使 用 鼠标 在 画布 内 绘制 曲线 。 按 下 鼠标 左 键 开 始 曲 线 的 绘 
制 。 按 下 鼠标 左 键 并 同时 移动 鼠标 时 ， 移 动画 笔 并 绘制 曲线 。 当 释放 鼠标 左 键 时 ， 完 成 曲线 
的 绘制 。 使 用 该 程序 的 一 个 涂鸦 如 图 9-11 所 示 。 

我 们 首先 创建 一 个 大 小 为 100 x 100 像素 的 canvas 组 件 。 由 于 绘制 图 形 通 过 按 下 鼠标 
左 键 开始 ， 因 此 需要 绑 定 事件 类 型 <Button-1> 到 一 个 事件 处 理 函 数 。 另 外 ， 由 于 按 住 鼠 


标 左 键 的 同时 移动 鼠标 会 绘制 曲线 ， 因 此 还 需要 绑 定 事件 类 型 <Button1-Motion> 到 另 
一 个 事件 处 理 函 数 。 
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图 9-11 画布 绘图 应 用 程序 。 该 GUI 实现 了 一 个 画笔 绘图 应 用 程序 。 按 下 鼠标 左 键 开始 绘制 
曲线 。 通 过 按 下 鼠标 左 键 的 同时 移动 鼠标 可 以 绘制 曲线 。 各 放 忆 标 大 键 时 停 下 会 制 


这 就 是 我 们 迄今 为 止 所 拥有 的 画布 绘图 程序 : 


模块 : draw.py 


1 from tkinter import Tk, Canvas 
# 开始 事件 处 理 并 开始 绘图 
root = Tk() 
oldx，oldy = 0, 0  # 鼠标 坐标 位 置 (全 局 变量 ) 


9 # canvas 画布 
0 Canvas = Canvas(root, height=100, width=150) 


canvas.bind("<Button-1>", begin) 


# 绑 定 当 按 下 鼠标 左 键 时 的 鼠标 行为 


canvas.bind("<Buttonl -Motion>3", draw) 


aa Canvas.pack() 
root .mainloop() 


接 下 来 需要 实现 事件 处 理 困 数 begin() 和 draw() 以 实际 绘制 曲线 。 我 们 首先 讨论 
draw( ) 的 实现 。 每 次 按 下 鼠标 左 键 的 同时 移动 鼠标 时 ， 将 调用 事件 处 理 遇 数 draw( )， 种 
一 个 输入 参数 : 一 个 存储 鼠标 新 位 置 的 Event 对 象 。 要 继续 绘制 曲线 ， 只 需要 把 鼠标 的 新 
位 置 和 前 一 个 位 置 用 一 条 线段 连接 起 来 。 显 示 的 曲线 将 是 一 系列 连接 前 后 鼠标 位 置 的 非常 短 
的 直线 段 

Canvas 的 方法 create_line() 可 以 用 于 绘制 两 个 点 之 间 的 线段 。 其 通用 格式 市 一 
个 输入 参数 ; 一 个 (x 芒 坐 标 序 列 (x1，Y1， xz2，Y2， 和 20， Yn)。 给 制 一 条 从 
点 (Xl1，Y1) 到 点 (x2， y2) 的 线段 ， 然 后 绘制 一 条 从 点 (x2，y2) 到 点 (x3，y3) 的 
线段 ， 以 此 类 推 。 因 此 ， 要 连接 鼠标 坐标 为 (oldx， oldy ) 的 旧 位 置 到 坐标 为 (newx， 
newy ) 的 新 位 置 ， 只 需要 执行 语句 : 


canvas.create_line(oldx, oldy, newx, newy) 
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曲线 通过 反复 连接 新 的 鼠标 位 置 到 旧 的 (先前 ) 鼠标 位 置 来 绘制 。 这 意味 者 必须 有 一 
个 “初始 ” 旧 鼠 标 位 置 ( 即 曲 线 的 开始 位 置 )。 这 个 位 置 由 鼠标 左 键 按 下 的 事件 处 理 程序 
begin( ) 设置 : 


模块 : draw.py 


def begin(event): 
' 将 曲线 的 开始 位 置 初始 化 为 当前 鼠标 位 置 ， 


global oldx, oldy 
oldx, oldy = event.x, event.,.y 


让 begin() 中 ,变量 oldx 和 oldy 接收 当 鼠标 左 键 按 下 时 鼠标 的 坐 
标 。 这 些 全 局 变量 将 不 断 被 事件 处 理 程序 draw( ) 更 新 ， 以 记录 鼠标 最 后 的 位 置 。 我 们 现 
在 可 以 实现 事件 处 理 程序 araw( ) : 


模块 : draw() 
| def draw(event) : 
' 使 用 线段 连接 鼠标 上 昌 位 置 和 新 位 置 ， 
global oldx, oldy, canvas # x 和 Yy 将 会 被 修改 
newx,，newy = event.x,，event.y # 新 的 鼠标 位 置 


# 用 线段 连接 鼠标 前 一 位 置 与 当前 位 置 


canvas.create_line(oldx, oldy, newx, newy) 


oldx, oldy = newx, newy # 新 位 置 变 成 前 一 位 置 


在 继续 下 一 节 之 前 ， 我们 在 表 9-8 列 出 了 canvas 组 件 支 持 的 一 些 方法 。 
表 9-8 一 些 Canvas 方法 。 其 中 列举 了 tkinter 组 件 类 canvas 的 少数 几 个 方法 。 在 画 
布 上 绘制 的 每 个 对 象 都 有 一 个 唯一 的 ID (恰好 是 一 个 整数 ) 
Modifier 说 了 明 
oreate Linetxl, yl x2, Y2r *") 创建 连接 点 (x1，y1)，(x2，y2),… 的 线段 ， 返 回 创建 的 项 的 ID 
create rectangle(xl, yl, x2, y2) 创建 顶点 为 (x1，y1l) 和 (x2，y2) 的 矩形， 返回 创建 的 项 的 ID 
创建 由 顶点 为 (x1，y1) 和 (x2，Y2) 的 矩形 约束 的 椭圆 ， 返 回 


create oval(xl1, yl: x2; Y2) 


创建 的 项 的 ID 
delete (ID) 删除 由 ID 标识 的 项 
move(item, dx, dy) 把 项 item 右 移 dx 个 单位 ， 下 移 dy 个 单位 


注意 事项 : 把 状态 保存 在 全 局 变量 中 

在 程序 draw.py 中， 变量 oldx 和 oldy 存储 鼠标 前 一 个 位 置 的 坐标 。 这 些 坐 标 最 
初 由 函数 begin() 设置 ， 然 后 由 函数 draw( ) 更 新 。 因 此 变量 oldx 和 oldy 不 可 能 是 
这 两 个 函数 的 局 部 变量 ， 它 们 必须 定义 为 全 局 变量 。 

使 用 全 局 变量 会 导致 不 安全 问题 ， 因 为 全 局 变量 的 范围 是 整个 模块 。 模 块 越 大 ， 包 含 
的 名 称 越 多 ， 我 们 就 越 有 可 能 在 模块 中 无 意 中 定义 一 个 名 称 两 次 。 当 从 另 一 个 模块 导入 变 
量 、 函 数 和 类 时 ， 这 种 情况 更 可 能 发 生 。 如 果 一 个 名 称 多 次 被 定义 ， 那 么 除了 一 个 定义 之 
外 ， 其 他 所 有 的 都 将 被 丢弃 ， 这 通常 会 导致 非常 奇怪 的 错误 。 


在 下 一 节 中 ， 我 们 学 习 如 何 使 用 面向 对 象 程序 设计 技术 开发 图 形 用 户 界 面 的 新 组 件 
类 。 其 优点 之 一 是 ， 我 们 能 够 在 实例 变量 中 存储 GUI 状态 ， 而 不 是 在 全 局 变量 中 存储 
GUI 状态 。 


实现 程序 daraw2.pYy (draw.py 的 一 个 修改 版 本 )， 支 持 通过 同时 
按 【 Ctrl 】 和 和 饼 标 左 键 来 删除 最 后 绘制 的 曲线 。 为 了 实现 该 功能 ， 需 要 删除 由 create 
line() 创建 的 、 构 成 最 终 绘 制 曲 线 的 所 有 短线 段 。 这 又 意味 着 必须 把 构成 最 后 的 曲线 的 所 
有 线段 保存 到 一 个 容器 中 。 


9.3.2 ”作为 组 织 容 器 的 组 件 Frame 


我 们 现在 介绍 Frame (框架 ) 组 件 。Frame 是 一 个 重要 的 组 件 ， 其 主要 目的 是 充当 其 
他 组 件 的 父 组 件 ， 并 方便 规范 GUI 的 几何 布局 。 我 们 在 另 一 个 称 之 为 PLottez (绘图 仪 ) 
的 图 形 GUI 中 使 用 它 ， 如 图 9-12 所 示 。plotter GUI 允许 用 户 通 过 在 画布 右边 提供 的 按 


钮 水 平 或 垂直 地 移动 画笔 来 绘图 。 要 求 点 击 一 次 按钮 可 以 在 按钮 指定 的 方向 移动 画笔 10 个 
像素 。 
tt tk 
2 
left right 
down 


图 9-12 绘图 仪 (plotter) 应 用 程序 。 该 GUI 包含 一 个 画布 和 四 个 控制 画笔 移动 的 按钮 。 每 个 
按钮 将 在 指定 的 方向 移动 画笔 10 个 单位 


很 显然 plotter GUI 包含 一 个 Canvas 组 件 和 四 个 Button 组 件 。 但 无 法 清楚 地 确认 
如 何在 父 组 件 〈 即 窗口 本 身 ) 指定 组 件 的 几何 布局 。pack() 方法 和 grid( ) 方法 都 不 适合 
于 直接 在 窗口 中 按 图 9-12 所 示 的 样式 布局 画布 和 按钮 。 

为 了 简化 几何 布 届 ,我 们 可 以 使 用 一 个 Frame 组件， 其 唯一 目的 是 作为 四 个 按钮 的 父 
组 件 。 组 件 的 层次 化 布局 分 两 步 实 现 : 首先 使 用 方法 grid() 把 四 个 按钮 布局 到 其 父 组 件 
Frame 中 ， 然 后 简单 地 把 canvas 和 Frame 组 件 并 排 布局 在 一 起 。 

模块 : plotter.py 
from tkinter Import Tk, Canvas, Frame, Button, SUNKEN, LEFT, RIGHT 
# 事 件 处 理 函 数 up ()、down ()、left () 和 right () 
root = Tk() 
# 边 框 大 小 为 100 x 150 的 画布 
s Canvas = Canvas(root, height=100, width=150, 


relief=SUNKEN, borderwidth=3) 
i% Canvas.pack(side=LEFT) 
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:。 # 四 个 按钮 置 于 框架 中 
1 box = Frame (root) 
4 box.pack(side=RIGHT) 


# 四 个 按钮 组 件 将 框架 组 件 作 为 父 组 件 (master) 
button = Button(box, text='up', command=up) 
is button.grid(row=0, column=0, columnspan=2) 
; button = Button(box, text='left',command=left) 
» button.grid(row=1, column=0) 
button = Button(box, text='right', command=right) 
button.grid(row=1, column=1) 
button = Button(box, text='down', command=down) 
: button.grid(row=2, column=0, columnspan=2) 


s X,Yy = 50，75 # 笔 的 位 置 ， 初始 位 于 当中 


5 root.mainloop() 


四 个 按钮 事件 处 理 函 数 用 于 在 对 应 方向 移动 画笔 。 这 里 我 们 只 讨论 up 按钮 的 事件 处 理 
呐 数 ， 其 他 三 个 事件 处 理 孔 数 作 为 课 后 练习 。 


模块 : plotter.py 


! def up(): 
' 将 画笔 向 上 移动 10 个 像素 ' 
global y, canvas # y 被 修改 
canvas.create_line(x, y, x, y-10) 
y -= 10 


知识 拓展 : 为 什么 当 向 上 移动 时 y 坐标 反而 减 小 ? 
函数 up() 用 于 把 画笔 从 坐标 位 置 (x, y) 向 上 移动 10 个 单位 。 在 典型 的 坐标 系统 中 ， 


这 意味 着 yy 应 该 增加 10 个 单位 。 但 是 ,程序 中 yy 的 值 减 少 了 10 个 单位 。 


( 0， 


这 样 做 的 原因 是 画布 中 的 坐标 系 与 我 们 习惯 的 坐标 系 不 太 相同 。 原 点 〈 即 坐标 位 置 
0 )) 位 于 画布 的 左上 角 。x 坐标 向 画布 右边 增加 ，y 坐标 向 画布 底部 增加 。 因 此 ， 向 


上 移动 意味 着 减少 y 坐标 ， 这 正 是 函数 up() 中 的 实现 方法 。 


虽然 特殊 ,但 画布 坐标 系统 遵循 屏幕 坐标 系统 。 屏 幕 上 的 每 个 像素 都 有 相对 于 屏幕 左 


上 角 的 坐标 ,左上 角 的 坐标 是 (0,，0 )。 为 什么 屏幕 坐标 系统 使 用 这 样 的 坐标 系统 呢 ? 、 


它 与 在 电视 机 (计算 机 显示 器 的 前 身 ) 中 刷新 像素 的 顺序 有 关 。 首 先 从 左 到 右 刷 新 像 


素 的 第 一 行 ， 然 后 刷新 第 二 行 、 第 三 行 ， 以 此 类 推 。 


9.4 


序 来 


二 3 攻 及 和 完成 实现 程序 plotter.py 中 的 函数 down()、left() 和 right()。 


面 问 对 象 的 图 形 用 亡 界 面 


到 目前 为 止 ， 本 音 介 绍 的 重点 是 了 解 如 何 使 用 tkinter 组 件 。 我 们 开发 了 GUI 应 用 程 
演示 组 件 的 用 法 。 为 了 让 事情 简单 化 ,我们 不 关心 GUI 应 用 程序 是 否 可 以 很 容易 地 被 


重用 。 


为 了 使 GUI 应 用 程序 或 者 任何 程序 可 以 重用 ， 它 应 该 被 开发 为 一 个 组 件 (一 个 函数 或 


类 )， 封 装 所 有 的 实现 细节 和 程序 中 定义 的 所 有 数据 (和 组 件 ) 的 引用 。 在 本 节 中 ， 我 们 介绍 
设计 GUI 的 面 回 对 象 的 程序 设计 方法 。 这 种 方法 将 使 我 们 的 GUI 应 用 程序 更 易于 重用 。 


9.4.1 GUI 面 问 对 象 程序 设计 基本 知识 


为 了 说 明 GUI 开发 的 面 问 对 象 程序 设计 方法 ， 我 们 重新 实现 了 应 用 程序 clickit. 
py。 这 个 应 用 程序 是 包含 一 个 按钮 的 GUI。 单 击 按钮 时 弹出 一 个 窗口 并 显示 当前 时 间 。 下 
面 是 我 们 的 原始 代码 (导入 语句 和 注释 语句 被 删除 ， 这 样 我 们 就 可 以 专注 于 程序 结构 ): 


模块 : clickit.py 


1! def clicked(): 
， 打印 日 期 和 时 间 信 息 ， 
time = strftime('Day: Yd %b YY\nTime: YX YXSB WPVA', 
localtime()) 
showinfo(message=time) 


7 root = Tk() 
s button = Button(root, 
text='Click it', 
command=clicked) ”# 按钮 单 击 事件 处 理 函 数 
1 button.pack() 
2 root.mainloop() 


这 个 程序 有 一 些 不 可 取 的 特性 。 名 称 button 和 clicked 具有 全 局 范围 。( 我 们 忽略 
窗口 组 件 root， 实际 上 它 “ 位 于 应 用 程序 之 外 ”， 稍 后 我 们 将 说 明 这 一 点 。) 而 且 ， 该 程序 
也 没有 封闭 到 一 个 单独 的 命名 组 件 (也 数 或 类 ) 中 ， 因 而 无 法 被 简洁 地 引用 或 整合 到 一 个 更 
大 的 GUI 中 。 

面向 对 象 程序 设计 的 GUI 开发 方法 的 核心 思想 是 开发 GUI 应 用 程序 作为 一 个 新 的 用 户 
和 目 定 义 的 组 件 类 。 组 件 是 一 个 复杂 的 东西 ， 从 零 开 始 实施 一 个 组 件 类 将 是 一 个 艰巨 的 任务 。 
OOP 的 继承 为 此 提供 了 挽救 方法 。 只 要 继承 一 个 现 有 组 件 类 的 属性 ， 就 可 以 确保 我 们 的 新 
类 是 一 个 组 件 类 。 因 为 我 们 的 新 类 包含 其 他 组 件 (按钮 )， 所 以 它 应 该 继承 一 个 可 以 包含 其 
他 组 件 的 组 件 类 (也 即 Frame 类 )， 

因此 ,重新 实现 GUI clickit。.py 包 含 定义 一 个 新 类 (例如 ，cClickIt)， 作 为 
Frame 的 子 类 。c1lickIt 类 中 仅 应 该 包含 一 个 按钮 组 件 。 由 于 按钮 必须 从 GUI 局 动 时 就 成 
为 GUI 的 一 部 分 ， 因 此 当 clickIt 组 件 实例 化 时 应 该 创建 和 布局 按钮 组 件 。 这 意味 着 必须 
在 ClickIt 构造 顺 数 中 创建 和 布局 按钮 组 件 。 

那么 ,按钮 的 父 组 件 是 什么 ?由 于 按钮 包含 在 实例 化 的 clickIt 组 件 中 ， 因 此 按钮 组 
件 的 父 组 件 是 ClickIt 组 件 本 身 (self)。 

最 后 ， 回 顾 一 下 ,我 们 在 创建 一 个 组 件 时 通常 会 指定 其 父 组 件 。 同 样 我 们 应 该 指定 
clickIt 组 件 的 父 组 件 ， 因 此 可 以 按 下 列 方法 创建 GUI: 

>>> root = Tk() 

>>> clickit = Clickit(root) # 在 root 中 创建 ClickIt 组 件 


>5> clhckit ,pack() 
>>> root .mainloop() 


因此 ，clickIt 构造 函数 应 该 定义 为 带 一 个 参数 : 其 父 组 件 。( 顺 便 说 一 下 ， 这 个 代码 
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显示 了 为 什么 我 们 没有 把 窗口 组 件 root 封装 到 clickIt 中 。) 
基于 上 述 知识 ,我们 可 以 开始 实现 clickIt 组 件 ， 特 别 是 它 的 构造 消 数 : 


模块 : ch9.py 


from tkinter import Button, Frame 
from tkinter.messagebox import showinfo 
from time import strftime, localtime 


class ClickIt (Frame): 
， 显示 当前 时 间 的 GUI ， 


def _ init__(self, master): 

”构造 函数 ， 

Frame.__init__(self, master) 

self .pack() 

button = Button(self, 
text=" GlicKk 1t'"; 
command=self .clicked) 

button .pack() 


# Clicked () 事件 处 理 函 数 


关于 构造 哺 数 ”init _() 需要 注意 三 点 : 首先 ， 在 第 10 行 ClickIt 构造 聘 数 
init  () 扩展 了 Frame 的 构造 函数 。 init  ()。 这 样 做 的 原因 有 下 列 两 点 : 

1. 我 们 希望 ClickIt 组 件 像 fFrame 组 件 一 样 初始 化 ， 以 保证 它 是 一 个 完整 的 框架 
部 件 ; 

2. 我 们 希望 clickIt 组 件 像 任何 其 他 框架 组 件 一 样 被 分 配 一 个 父 组 件 ， 因 此 我 们 把 
ClickIt 构造 也 数 的 master 输入 参数 传递 给 Frame 的 构造 蚂 数 。 

其 次 要 注意 的 是 ，button 不 是 一 个 全 局 变量 ， 与 在 原始 程序 clickit .py 中 是 一 个 
全 局 变量 相 比 ， 目 前 它 只 是 一 个 局 部 变量 ， 不 会 影响 使 用 类 click 的 程序 中 定义 的 名 称 。 
最 后 要 注意 的 是 我 们 定义 按钮 事件 处 理 函 数 为 self .clicked,， 这 意味 着 clicked() 是 
类 clickIt 的 一 个 方法 。 代 码 实 现 如 下 : 


模块 : ch9.py 


def clicked(self) : 
”打印 日 期 和 时 间 信 息 ， 
time = strftime('Day: %d %b %nY\nTime: %H:%M:%S %p\n', 
localtime()) 
showinfo(message=time) 


因为 它 是 一 个 类 方法 ， 因 此 名 称 clicked 不 是 一 个 全 局 名 称 ， 这 区 别 于 原始 程序 
Gl 二 匡 人 

因此 ， 类 clickIt 封装 代码 和 名 称 (clicked 和 button)。 这 意味 着 ， 这 些 名 称 对 
使 用 clickIt 组 件 的 程序 都 不 可 见 ， 这 使 开发 人 员 不 需要 担心 是 否 程序 中 的 名 称 会 发 生 冲 
突 。 此 外 ， 开 发 者 会 发 现在 一 个 大 的 GUI 中 整合 使 用 clickIt 组 件 非常 容易 。 例 如 ， 下 面 
的 代码 将 在 一 个 窗口 中 整合 使 用 clickIt 组 件 ， 并 启动 GUI: 


9.4.2 


root = Tk() 

app = Clickit(root) 
app.pack() 

root .mainloop() 


把 共享 组 件 赋值 给 实例 人 


= 
时 


So 
~ 
在 下 一 个 例子 中 ， 我 们 将 GUI 应 用 程序 day .py 重新 实现 为 一 个 类 。 我 们 用 它 来 说 明 


何 时 给 出 组 件 实例 变量 名 。 原 始 程序 day .py (同样 省 略 了 导入 语句 和 注释 语句 ) 如 下 : 


模块 : day.py 


def compute() : 
global dateEnt  #dateEnt 是 全 局 变量 


date = dateEnt .get() 

weekday = strftime('%A', strptime(date, '%b %d, %Y')) 
showinfo(message = '{} was a {}'.format(date, weekday)) 
dateEnt .delete(0, END) 


OOt = TK() 


label = Label(root, text='Enter date') 
label .grid(row=0, column=0) 


dateEnt = Entry(root) 
dateEnt .grid(row=0, column=1) 


button = Button(root, text='Enter', command=compute) 
button.grid(row=1, column=0, columnspan=2) 


root .mainloop() 


在 上 述 实 现 中 ， 名称 compute、label、dateEnt 和 button 具有 全 局 作用 范围 。 
我 们 重新 实现 该 程序 ， 采 用 类 ( 称 之 为 Day) 的 方式 来 封装 这 些 名 称 和 代码 。 

Day 构造 六 数 应 该 负责 创建 标签 、 输 入 框 和 按钮 组 件 ， 正 如 ClLickIt 构造 师 数 负责 创 
建 按钮 组 件 一 样 。 虽 然 有 一 处 不 同 : 输入 框 dateEnt 被 事件 处 理 师 数 compute( ) 引用。 
基于 这 个 原因 ，dateEnt 不 能 作为 Day 构造 困 数 的 局 部 变量 。 作 为 蔡 代 ， 我 们 把 它 作 为 一 
个 实例 变量 ， 从 而 可 以 被 事件 处 理 虽 数 引用 : 


模块 : ch9.py 


from tkinter import Tk, Button, Entry, Label, END 
from time import strptime, strftime 
from tkinter.messagebox import showinfo 


class Day (Frame).: 


' 计算 指定 日 期 所 对 应 的 星期 的 应 用 程序 


def __init__(self, master): 


Frame.__init__“(self, master) 
self .pack() 
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label = Label(self, text='Enter date') 
label .grid(row=0, column=0) 


self.dateEnt = Entry(self) # 实例 变量 
self.dateEnt .grid(row=0, column=1) 


button = Button(self, text='Enter', 
command=self .compute) 
button.grid(row=1, column=0, columnspan=2) 


def compute(self) : 
' 显示 采用 dateEnt 格式 的 日 期 所 对 应 的 星期 ， 
日 期 格式 必须 为 : MMM DD ，YYYY (e.g., Jan 21，1967) ''' 
date = self.dateEnt.get'() 
weekday = strftime('%A', strptime(date, '%b %d, %Y')) 
showinfo(message = '{} was a {}'.format(date, weekday)) 
self.dateEnt.delete(0 ，END) 


Label 和 Button 组 件 则 不 需要 赋值 给 实例 变量 ， 因 为 它们 永远 不 会 被 事件 处 理 消 数 
引用 。 它 们 仅仅 给 定 相 对 于 构造 师 数 的 局 部 变量 名 称 。 事 件 处 理 吨 数 compute( ) 是 一 个 类 
方法 ,正如 clickIt 中 的 clicked() 方法 。 事 实 上 ,在 用 户 自 定义 组 件 中 事件 处 理 清 数 
永远 是 类 方法 。 

因此 ， 类 Day 封装 了 程序 day .py 中 的 四 个 全 局 范围 的 名 称 。 正 如 clickIt 类 一 样 ， 
把 一 个 Day 组 件 整 合 到 一 个 GUI 变 得 非常 容易 。 为 了 说 明 这 一 点 ， 让 我 们 允许 组 合 这 两 个 
日 定义 组 件 的 GUI: 


>>> root = Tk() 

>>> day = Day(root) 

>>> day.pack() 

>>> clickit = ClickIt (root) 
>>> clickit.pack() 

>>> root .mainloop() 


yf tk 
tnter date 
tnter 
Click if 
图 9-13 ”一 个 GUI 中 的 两 个 用 户 自 定义 组 件 。 一 个 用 户 自 定义 组 件 可 以 像 一 个 内 置 组 件 类 一 样 使 用 
图 9-13 显示 了 结果 GUI， 包 括 一 个 Day 组 件 ,位 于 一 个 clickIt 组 件 之 上 。 
3 中: 汕 重新 实现 GUI 应 用 程序 keylogger .py 为 一 个 新 的 用 户 自 定义 组 件 类 。 
请 确定 是 否 需 要 把 包含 在 该 组 件 中 的 Text 组 件 赋值 给 一 个 实例 变量 ， 


9.4.3 ”把 共享 数据 赋值 给 实例 变量 

为 了 进一步 演示 将 一 个 GUI 作为 一 个 用 户 自 定义 组 件 类 实现 的 封装 优点 ， 我 们 重新 实 
现 GUI 应 用 程序 draw .py。 回 顾 发 现 此 应 用 程序 提供 一 个 画布 ， 用 户 可 以 使 用 鼠标 在 上 面 
画 网 。 原 始 的 实现 如 下 : 
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模块 : draw.py 


from tkinter import Tk, Canvas 


; def begin(event): 

: ， 将 曲线 的 起 始 位 置 初始 化 为 鼠标 位 置 ， 
global oldx, oldy 

6 oldx, oldy = event.x, event.y 


s def draw(event): 

9 ， 从 鼠标 旧 位 置 到 新 位 置 之 间 画 一 根 线段 ， 
global oldx, oldy, canvas # X 和 Y 将 被 更 新 
newx, newy = event.X，event.y # 新 的 鼠标 位 置 

1 canvas.create_line(oldx, oldy, newx, newy) 

oldx, oldy = newx, newy # 新 的 鼠标 位 置 变 成 前 一 位 置 


root = Tk() 
7 Oldx, oldy = 0，0  # 鼠标 位 置 (全 局 变量 ) 


canvas = Canvas(root, height=100, width=150) 
2 Canvas.bind("<Button-1>", begin) 

canvas.bind("<Buttoni1-Motion>", draw) 

canvas .pack() 


»” root.mainloop() 


在 最 初 的 实现 draw .py 中 ,我 们 需要 使 用 全 局 变量 oldx 和 oldy 来 跟 踊 鼠标 移动 。 
这 是 因为 事件 处 理 困 数 begin() 和 draw() 会 引用 它们 。 在 作为 一 个 新 的 组 件 类 的 重新 实 
现 中 ， 作 为 替代 ， 我 们 可 以 把 鼠标 坐标 存储 在 实例 变量 中 。 

同样 ， 因 为 canvas 被 事件 处 理 吨 数 draw( ) 引用 ,我 们 同样 需要 把 它 作 为 实例 变量 : 


模块 : ch9.py 


1， from tkinter import Canvas, Frame, BOTH 
class Draw(Frame): 


3 ' 一 个 基本 绘图 应 用 程序 ， 


def __init__(self, parent): 


Frame..__init__(self, parent) 
self .pack() 


9 # 鼠标 坐标 是 实例 变量 
10 self.oldx, self.oldy = 0, 0 


ia # 创建 画布 ， 并 绑 定 鼠 标 事件 到 处 理 函 数 

13 self.canvas = Canvas(self, height=100, width=150) 
self.canvas.bind("<Button-1>", self .begin) 
self .canvas.bind("<Buttonil-Motion>", self .draw) 

16 self.canvas.pack(expand=True, fill=BOTH) 


18 def begin(self ,event) : 
， 通过 记录 鼠标 位 置 处 理 左 键 单 击 ， 


20 self .oldx, self.oldy = event.x, event.y 
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def draw(self, event): 
' 处 理 按 住 左 键 时 的 鼠标 移动 ， 
用 线段 连接 鼠标 前 一 位 置 和 当前 的 新 位 置 ，'， 
newx, newy = event.x, event.y 
self .canvas.create_line(self.oldx, self.oldy, newx, newy) 
self.oldx, self.oldy = newx, nevwy 


了 有 和 重新 实现 绘图 仪 程序 ， 将 其 作为 一 个 用 户 自 定义 组 件 类 ， 以 封装 绘图 仪 
的 状态 ( 即 画 笔 位 置 )。 请 仔细 苦 酌 哪些 组 件 需 要 赋值 给 实例 变量 。 


9.5 电子 教程 案例 研究 : 开发 一 个 计算 器 


在 案例 研究 CS.9 中 ， 我 们 实现 一 个 基本 计算 需 GUI。 我 们 使 用 OOP 技术 ， 从 无 到 有 ， 
将 其 实现 为 一 个 用 户 自 定义 组 件 类 。 在 整个 过 程 中 ， 我 们 解释 如 何 编写 唯一 一 个 事件 处 理 明 
数 来 处 理 多 个 不 同 按钮 事件 。 


9.6 ”本 章 小 结 


本 章 介绍 了 在 Python 中 GUI 的 开发 技术 。 

我 们 使 用 的 特定 的 Python GUI API 是 标准 库 模 块 tkinter。 该 模块 定义 了 对 应 于 
典型 GUI 元 素 的 组 件 ， 例 如 按钮 、 标 签 、 输 入 框 等 。 本 曹 主要 涉及 组 件 类 Tk、Label、 
Button、Text、Entry、Canvas 和 Frame。 要 了 解 有 关 其 他 tkinter 组 件 类 的 信息 ， 
我 们 给 出 了 在 线 tkinter 文档 的 链接 。 

指定 组 件 在 一 个 GUI 的 几何 位 置 ( 即 布 局 ) 有 若干 技术 。 我 们 介绍 了 组 件 类 方法 
pack() 和 grid()。 我 们 还 说 明了 如 何 把 组 件 组 织 为 层次 结构 以 促进 复杂 GUI 的 几何 

GUI 是 交互 式 程序 ， 可 以 啊 应 用 户 产生 的 事件 ,例如 鼠标 单 击 、 鼠 标 移动 、 键 盘 按 键 。 
我 们 描述 了 如 何 定义 事件 处 理 靖 数 ， 以 啊 应 这 些 事 件 。 开 发 事件 处 理 也 数 ( 即 啊 应 事件 的 也 
数 ) 是 一 种 被 称 为 事件 驱动 程序 设计 的 编程 风格 。 我 们 将 在 第 11 章 中 讨论 HTML 文件 解析 
时 再 度 涉及 该 编程 风格 。 

最 后 (或许 是 最 重要 的 一 点 )， 我 们 使 用 GUI 开发 上 下 文 演示 了 OOP 的 优越 性 。 我 们 描 
述 了 如 何 将 GUI 应 用 程序 开发 为 一 个 新 的 组 件 类 ， 从 而 可 以 方便 地 整合 到 大 型 的 GUI 中 。 
在 这 个 过 程 中 ,我 们 应 用 了 OOP 概念 ， 包括 继 承 、 模 块 化 、 抽 象 和 封装 。 


9.7 练习 题 答案 

9.1 可 以 使 用 width 和 height 选项 来 指定 文本 标签 的 宽度 和 高 度 (注意 ， 宽 度 20 指标 签 内 部 可 以 
容纳 20 个 字符 )。 为 了 在 peace 符号 组 件 周围 填充 空白 ， 调 用 pack( ) 时 使 用 了 选项 expand 
= True 和 £ill = BOTH。 


模块 : peaceandlove.py 
from tkinter import Tk, Label, Photolmage, BOTH, RIGHT, LEFT 
root = Tk() 


! labell = Label(root, text="Peace & Love", background='black', 
width=20, height=5, foreground='white', 
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6 font=('Helvetica', 18, ,italic 
labell.pack(side=LEFT) 


photo = PhotolImage (file='peace.gif') 


1 label2 = Label(root, image=photo) 
label2.pack(side=RIGHT, expand=True, fill=BOTH) 


“4 root.mainloop() 


9.2 ”使 用 迭代 使 得 创建 所 有 标签 的 过 程 可 控 。 第 一 行 的 “一 周 的 星期 ”可 以 通过 如 下 最 佳 方法 来 实现 : 
创建 一 个 星期 列表 ， 过 代 该 列表 ， 每 次 迭代 创建 一 个 标签 组 件 并 放置 到 行 0 的 对 应 列 。 相 关 代 码 
如 下 所 示 。 


模块 : ch9.py 


days = L ea， Tue!, Ved', "Thu, "Eri', Sa Sun’] 
# 创建 并 放置 星期 标签 
3 for i in range(7) : 
4 label = Label(root, text=days[i]) 
label.grid(row=0, column=i) 


迭代 也 用 于 创建 和 放置 数值 标签 。 变 量 week 和 weekday 分 别 表示 行 和 列 。 


模块 : ch9.py 


# 获取 月 份 的 第 一 个 星期 信息 ， 
# 以 及 指定 月 份 中 的 天 数 
weekday, numDays = monthrange(year, month) 


4 # 从 星期 一 (第 一 行 ) 和 第 一 天 (第 一 列 ) 开始 创建 日 历 

5 week = 1 

6 for 9 4 ange(1l, TmDayvet1)i # 对 于 = 1 5， tmDays 
# 创建 标签 工 ， 并 将 其 置 于 week 行 weekday 列 


8 label = Label (root, text=str(i)) 
label.grid(row=week, column=weekday) 


和 # 更 新 weekday ( 列 ) 和 week ( 行 ) 
1 weekday += 1 
: if weekday > 6: 
14 week += 1 
weekday = 0 


9.3 ”应 该 创建 两 个 按钮 而 不 是 一 个 按钮 。 下 列 代码 片段 显示 了 对 应 各 个 按钮 的 独立 的 事件 处 理 函 数 。 


模块 : twotimes.py 


' def greenwich(): 

! 打印 格林 尼 治 的 日 期 和 时 间 信 息 ， 

time = strftime('Day: YXa %b %Y\nTime: WH:XM:%S Wp\n's 
1 gmtime()) 

print('Greenwich time\n' + time) 


def local(): 
' 打印 当地 的 日 期 和 时 间 信 息 ， 
time = strftime('Day: %d %b %Y\nTime: %H:%M:%S %p\n', 
localtime()) 
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1 print('Local time\n’' + time) 


# 当地 时 间 按 钮 
buttonl] = Button(root, text='Local time', command=local) 
buttonl .pack(side=LEFT) 


# 格林 尼 治 时 间 按 钮 
buttong = Button(root,text='Greenwich time', command=greenwich) 
buttong.pack(side=RIGHT) 


9.4 我 们 仅仅 描述 在 程序 day .py 上 的 改变 部 分 。 按 钮 “Enter” 的 事件 处 理 晒 数 compute( ) 应 该 
修改 为 : 


def compute() : 
global dateEnt  # 注 意 : dateEnt 是 全 局 变量 
# 从 输入 框 dateEnt 处 读 取 数据 
date = dateEnt.get() 
# 计算 指定 日 期 相对 应 的 星期 
weekday = strftime('%A', strptime(date, '%b %d, %Y')) 
# 采用 弹出 式 窗口 显示 星期 
dateEnt.insert(0, weekday+' ') 


按钮 “Clear” 的 事件 处 理 陆 数 应 该 为 : 
def clear(): 
' 清除 dateEnt ， 
global dateEnt 
dateEnt .delete(0, END) 
最 后 ， 和 名 按钮 的 定义 方式 如 下 所 示 : 
# Enter 按钮 


button = Button(root, text='Enter', command=compute) 
button.grid(row=1, column=0) 


# Clear 按钮 
button = Button(root, text='Clear', command=clear) 
button.grid(row=1, column=1) 


9.5 我 们 应 该 绑 定 【 回 车 】 键 到 一 个 事件 处 理 陆 数 ， 哨 数 市 一 个 输入 参数 : 一 个 Event 对 象 。 该 曙 
数 的 功能 是 调用 处 理 遇 数 compute( ) 。 因 此 我 们 仅仅 需要 在 day .py 中 添加 如 下 代码 : 


def compute2(event) : 
compute() 


dateEnt .bind('<Return>', compute2) 


如 ， 列 表 curve)。 每 次 开始 绘图 时 ， 列 表 应 该 初始 化 为 空 : 


模块 : draw.py 


def begin(event): 
' 将 曲线 的 起 点 初始 化 为 当前 鼠标 位 置 ， 
global oldx, oldy, curve 
oldx, oldy = event.x, event.y 
curve = [] 
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当 我 们 移动 鼠标 时 ， 需 要 把 Canvas 方法 creat line() 创建 的 线段 的 ID 附加 到 列表 
curve。 这 体现 在 事件 处 理 图 数 draw( ) 的 重新 实现 中 ， 如 下 所 示 。 


模块 : draw2.py 


def draw(event) : 
2 ， 绘制 一 条 从 旧 鼠 标 位置 到 新 鼠标 位 置 的 线段 ， 
3 global oldx，oldy，canvas，curve # X 和 Y 将 会 被 更 新 
4 newx, newy = event.x, event.y # 新 的 鼠标 位 置 
, # 连接 前 一 鼠标 位 置 和 当前 鼠标 位 置 
6 curve.append(canvas.create_line(oldx, oldy, newx, newy)) 
oldx, oldy = newx, newy # 新 的 鼠标 位 置 变 成 前 一 鼠标 位 置 
def delete(event) : 
， 删除 上 次 绘制 的 曲线 ， 
10 global curve 
11 for Segment in curve: 
12 canvas.delete(segment) 
3 # 将 【Ctrl 】+ 左 鼠标 键 单 击 绑 定 到 delete () 


4 Canvas .bind('<Control-Button-1>'，delete) 


<Control-Button-1> 事件 类 型 的 事件 处 理 艺 数 delete( ) 应 该 迭代 curve 中 的 每 个 线 
段 ID， 并 调用 canvas .delete( ) 删除 。 
9.7 其 实现 类 似 于 函数 up( ) : 


' def down(): 
2 ' 将 画笔 下 移 10 个 像素 ， 
3 global y, canvas # Y 被 更 新 
4 canvas.create_line(x, y, x, y+10) 
y += 10 
def left(): 
' 将 画笔 左 移 10 个 像素 ， 
8 global x, canvas # XX 被 更 新 
9 canvas.create_line(x, y, x-10, y) 
10 x -= 10 
1 def right(): 
入 ' 将 画笔 右 移 10 个 像素 ， 


global x, canvas # 色 被 更 新 
14 canvas.create_line(x, y, x+10, y) 
5 » 
9.8 ”因为 事件 处 理 也 数 没有 使 用 Text 组 件 ， 因 此 不 需要 把 它 赋 值 给 一 个 实例 变量 。 
模块 : ch9.py 


from tkinter import Text, Frame, BOTH 
class KeyLogger (Frame) : 
3 ， 一 个 记录 按键 日 志 的 基本 编辑 器 ， 
4 def __init__(self, master=None): 
Frame.__init__(self, master) 
self .pack() 
text = Text (width=20, height=5) 
8 text.bind('<KeyPress>', self .record) 
9 text.pack(expand=True, fill=BOTH) 
def record(self, event): 
'，'， 通过 打印 与 按键 相关 的 字符 
2 处 理 按键 事件 ' 
13 print('char={}'.format (event .keysym)) 


时 


9.8 


9.10 


$13 


9.9 


9.16 
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只 有 canvas 组 件 被 处 理 按钮 单 击 的 函数 move( ) 所 引用 ,. 因此 它 是 唯一 需要 赋值 给 一 个 实 
例 变 量 ( self .canvas) 的 组 件 。 画 笔 的 坐标 ( 即 状态 ) 也 必须 存储 在 实例 变量 self .x 和 
self .y 中 。 答 案 在 模块 ch9 .py 中 。 下 面 是 构造 图 数 代码 片段 ， 创 建 按 钮 “up ”及 其 事件 处 理 
曙 数 ， 其 他 按钮 类 似 。 


模块 : ch9.py 
# 创建 up 按钮 


b = Button(buttons, text='up', command=self .up) 
b.grid(row=0, column=0, columnspan=2) 


def up(self).: 

， 将 画笔 上 移 10 个 像素 ， 
> self.canvas.create_line(self.x, self.y, self.x, self.y-10) 
8 self.y -= 10 


习题 
开发 一 个 程序 显示 一 个 GUI 窗口 ， 使 你 的 照片 位 于 左 侧 ， 你 的 名 、 姓 、 出 生地 、 出 生日 期 位 于 
右 侧 。 照 片 必 须 为 GIF 格式 。 如 果 没 有 这 种 格式 的 照片 ， 请 在 网 上 搜索 一 个 免费 的 图 像 转 换 工 
具 ， 然 后 把 一 张 JPEG 照片 转换 为 GIF 格式 。 
修改 练习 题 9.3 的 答案 ， 使 得 时 间 信 息 显 示 在 单独 的 弹出 窗口 。 
修改 9.1 节 的 电话 号 码 拨号 盘 GUI， 使 用 按钮 代替 数字 。 当 用 户 拨 一 个 号 码 时 ， 号 码 数字 应 该 
输出 在 交互 式 命 令 行 中 。 
在 程序 plotter .py 中 ， 用 户 必 须 单 击 四 个 按钮 之 一 以 移动 画笔 。 修 改 程序 ， 人 允许 用 户 使 用 键 
盘 上 的 方向 键 来 代 奉 按钮 移动 画笔 。 
在 组 件 类 Plotter 的 实现 中 ,包含 四 个 非常 类 似 的 按钮 事件 处 理 明 数 : up()、down()、 
left() 和 right()。 重 新 实现 类 ,使 用 一 个 阴 数 move()， 和 市 两 个 输入 参数 dx 和 dy， 把 画 
笔 从 位 置 (x, y) 移动 到 (x+dx, yt+dy)。 
添加 两 个 按钮 到 Plotter 组 件 。 其 中 一 个 按钮 标 有 “clear” 文 字 ， 用 于 清空 画布 。 男 一 个 按 
钮 标 有 “delete ”文字 ， 用 于 删除 最 后 一 次 画笔 移动 。 


实现 一 个 GUI 应 用 程序 ， 人 允许 用 户 计算 人 体 体 重 指 数 ( BMI) (在 练习 题 5.1 中 定义 )。 要 求 GUI 
显示 如 下 : 


AMA tk 
Enter your height 
Enter your weight 


Compute 8MI 


输入 体重 ( weight) 和 身高 (height) 并 单 击 按钮 后 ， 要 求 弹 出 一 个 新 的 窗口 ， 显 示 计 算 后 
的 BMI。 请 确保 GUI 用 户 友好 : 删除 输入 的 体重 和 身高 ， 以 便 用 户 输入 新 的 数据 而 无 需 手 动 删 
除 旧 的 数据 。 
开发 一 个 GUI 应 用 程序 ， 其 目的 是 基于 贷款 总 额 (美元 $)、 利 率 ( %)、 贷 款 期 限 ( 即 偿还 贷款 
的 月 数 )， 计 算 抵押 贷款 每 月 的 还 款 金 额 。 要 求 GUI 包含 三 个 标签 和 三 个 输入 框 供用 户 输入 信 
息 。 还 包含 一 个 标 有 “计算 按揭 ”文字 的 按钮 ， 单 击 该 按钮 时 ， 计 算 每 月 还 款 金 额 并 在 第 四 个 
输入 框 中 显示 。 


9.18 


2 


9.23 
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每 月 还 款 金额 通过 贷款 总 额 a、 利 率 r 和 贷款 期 数 1:， 按 下 列 公式 来 计算 : 
RE axcx(l+c) 
(1+c) 一 ] 
其 中 栋 二 r/1200。 
开发 一 个 GUI， 仅 包含 一 个 大 小 为 480 x 640 的 Frame 组 件 ， 具 有 下 列 行为 : 每 次 用 户 鼠 标点 
击 该 框架 中 的 某 个 位 置 时 ， 在 交互 式 命令 行 中 输出 该 位 置 的 坐标 。 
33S 
you clicked at (55, 227) 


you clicked at (426, 600) 
you clicked at (416, 208) 


修改 9.1 节 中 的 电话 号 码 拨号 盘 GUI， 使 用 按钮 代替 数字 ， 且 在 上 部 增加 一 个 输入 框 。 当 用 户 
拨号 时 ， 号 人 码 应 该 按 传统 的 美国 电话 号 码 格 式 显示 。 例 如 ， 如 果 用 户 输 入 1234567890， 则 输入 
框 应 该 显示 123-456-7890。 

开发 一 个 新 的 组 件 Game ， 实 现 猜 数 游戏 。 程 序 启动 时 ， 随 机 选择 一 个 0 到 9 之 间 的 保密 数字 。 
然后 要 求 用 户 输入 数字 猜测 。GUI 应 该 包含 一 个 Entry 组件 〈 用 于 用 户 输入 数字 猜测 ) 和 一 个 
Button 按钮 《用 于 用 户 确 认 猜 测 ): 


A MN Mk 


tnter your guess 


Enter 


如 果 猜 测 结果 正确 ， 则 弹出 单独 的 窗口 通知 用 户 猜 测 正确 。 用 户 可 以 不 断 输 入 猜测 直到 和 猜 
中 正确 答案 。 
在 思考 题 9.20 中 ， 输 入 一 个 数字 猜测 后 按键 盘 上 的 【 回 车 】 键 将 被 忽略 。 修 改 Game GUI 程序 ， 
使 得 按 【 回 车 】 键 的 行为 等 同 于 单 击 按钮 。 
修改 思考 题 9.21 中 的 组 件 Game ， 当 用 户 猜 出 正确 数字 之 后 ， 自 动 开始 一 个 新 的 游戏 。 窗 口 信 
奶 通 知 用 户 猜 测 正确 ， 例 如 “让 我 们 再 玩 一 次 …”。 注 意 ， 每 次 开始 一 个 新 的 游戏 时 ， 必 须 重 新 
随机 选择 一 个 数字 。 
实现 GUI 组 件 craps， 模拟 赌 博 游 戏 撕 骨 子 。GUI 应 该 包含 一 个 按钮 ， 用 以 开始 一 个 新 的 游戏 ， 
模拟 一 对 仍 子 的 初始 投掷 。 然 后 把 初始 投掷 的 结果 显示 在 一 个 Entry 组 件 中 ， 如 下 所 示 。 


A tk 


Your roll 
New qame Roil for pont 


如 果 初 始 投掷 既 没 有 最 也 没有 输 ， 则 用 户 必 须 继续 单 击 "Roll for point"， 直 到 获胜 。 
开发 一 个 应 用 程序 ， 包 含 一 个 文本 框 ， 测量 你 打字 的 速度 。 程 序 应 该 记录 你 键入 第 一 个 字符 的 
时 间 。 然 后 ， 每 次 按 空 格 键 时 ， 完 成 下 列 功 能 : (1 ) 输出 你 键入 前 一 个 单词 所 用 的 时 间 ; (2) 
通过 将 目前 为 止 所 输入 单词 的 平均 耗费 时 间 换 算 为 每 分 钟 的 单词 个 数 ， 估 算 并 输出 你 输入 单词 
的 速度 。 因 此 ， 如 果 每 个 单词 平均 时 间 为 2 秒 钟 ， 则 换算 后 的 结果 为 每 分 钟 30 个 单词 。 
开发 一 个 新 的 GUI 组 件 类 Ed， 可 以 用 于 教 一 年 级 学 生 加 减法 计算 。GUI 应 该 包含 两 个 Entry 
组 件 和 一 个 标 有 “Enter” 文 字 的 Button 组 件 。 

程序 启动 时 ， 首 先 使 用 random 模块 中 的 randrange( ) 函数 生成 : (1 ) 两 个 一 位 数 的 父 


故 形 爵 户 看 面 es gy 


随机 数 a 和 b; (2 ) 一 个 运算 符 o， 可 以 是 加 法 或 减法 (概率 相同 )。 然 后 在 第 一 个 Entry 组 件 
中 显示 表达 式 a o b (如 果 a 小 于 b 且 运 算 符 o 是 减法 ， 则 显示 b o a， 以 确保 结果 永远 不 为 
负数 )。 例 如 ， 显 示 的 表达 式 可 能 是 3+2、4+7、5-2 或 者 3-3， 但 不 能 是 2-6。 

用 户 在 第 二 个 Entry 框 中 输入 第 一 个 Entry 中 表达 式 的 结果 ， 然 后 单 击 “ Enter” 按 钮 
(或 按键 盘 上 的 【 回 车 】 键 )。 如 果 输 入 了 正确 的 答案 ， 则 弹出 一 个 新 窗口 ， 显 示人 信息:“ 答 案 
正确 !”。 
扩展 思考 题 9.25 中 开发 的 GUI， 当 用 户 回 答 正确 后 ， 生 成 一 个 新 的 问题 。 另 外 ， 程 序 还 应 该 记 
录 每 个 问题 的 尝试 次 数 ， 并 在 用 户 回答 正确 后 显示 的 信息 中 显示 。 
增强 思考 题 9.26 中 开发 的 组 件 Ed 的 功能 ， 使 得 程序 不 重复 最 近 出 现 过 的 问题 。 更 准确 地 说 ， 
确保 新 的 问题 与 前 面 的 10 道 题 不 重复 。 
开发 组 件 caLlendar， 实 现 一 个 基于 GUI 的 日 历 应 用 程序 。calendar 构造 阴 数 带 三 个 输入 
参数 : 父 组 件 、 年 、 月 (使 用 数值 1 到 12 )。 例 如 ，calendar (root， 2012， 2) 在 父 组 件 
root 中 创建 一 个 calendar 组 件 。 该 Calendar 组 件 显示 给 定年 和 月 的 日 历 页 ， 每 天 显示 为 
一 个 按钮 : 


然后 ， 当 用 户 单 击 茶 一 天 的 按钮 ， 则 弹出 一 个 对 话 框 : 


HN example 
EnNter Yex' 


dentist apps 


srg es Cancel 


对 话 框 包含 一 个 输入 框 字段 ， 用 于 输入 一 个 预约 。 当 用 户 单 击 按钮 “OK” 后 ， 关 闭 对 话 
杠 。 然 而 ， 当 用 户 在 主 日 历 窗口 中 重新 单 击 同一 天 的 按钮 时 ， 将 重新 打开 对 话 框 ， 同 时 显示 该 
预约 信息 。 

可 以 使 用 模块 tkinter.simpledialog 中 的 askstring 困 数 来 显示 对 话 框 。 它 带 两 个 
输入 参数 : 窗口 标题 和 标签 ,返回 用 户 键入 的 任何 内 容 。 例 如 ， 上 一 个 对 话 框 使 用 下 列 函 数 调 
用 来 创建 : 

askstring('example', 'Enter text') 

当 用 户 单 击 “OK”， 哨 数 调用 返回 用 户 在 输入 框 中 键入 的 内 容 。 

该 图 数 还 可 以 带 一 个 可 选 参数 initialvalue， 把 一 个 字符 串 作 为 初始 值 放 置 到 输入 字段 : 

askstring('example', ' Enter text', initialvalue='appt with John') 
修改 思考 题 9.28 中 的 类 Calendar ， 使 得 其 适用 于 任何 年 和 月 。 程 序 启动 时 ， 显 示 当 前 月 份 的 
日 历 页 。 程 序 应 该 包含 两 个 额外 的 标 有 “previous ”和 “next” 文 字 的 按钮 ， 单 击 按钮 时 ， 将 切 
换 到 前 一 个 月 或 下 一 个 月 的 日 历 页 。 
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在 本 草 中 ， 我 们 学 习 递 归 一 一 一 种 强大 的 问题 求解 技术 ， 并 分 析 其 运行 时 间 。 

递归 是 一 种 问题 求解 技术 ， 它 把 一 个 问题 的 求解 表述 为 原始 问题 的 子 问 题 求解 。 递 归 可 
以 用 来 求解 其 他 方法 很 难 解决 的 问题 。 通 过 递归 地 解决 问题 而 开发 的 函数 自然 会 调用 限 数 
本 吴 ， 我们 把 这 些 函 数 称 为 递归 函数 。 我 们 还 将 讨论 名 称 空 间 和 程序 栈 如 何 支 持 递 归 函 数 的 
执行 。 

我 们 演示 了 递归 在 数字 模式 、 分 形 、 病 毒 扫 摘 希 和 搜索 中 的 广泛 应 用 。 我 们 区 分 线性 和 
非 线 性 递归 ， 并 说 明 迭 代 和 线性 递归 之 间 的 密切 关系 。 

当 我 们 讨论 什么 时 候 该 使 用 递归 和 什么 时 候 不 该 使 用 递归 时 ， 需 要 面 对 的 是 程序 运行 时 
间 问 题 。 到 目前 为 止 ， 我 们 对 程序 的 效率 并 不 太 担 心 。 现 在 纠正 这 种 情况 ， 并 利用 这 个 机 会 
分 析 几 个 基本 的 搜索 任务 。 我 们 开发 了 一 个 工具 ， 可 以 用 来 对 明 数 相对 于 输入 大 小 而 言 的 运 
行 时 间 进行 实验 分 析 。 


10.1 递归 简介 


递归 因数 是 一 个 调用 目 身 的 图 数 。 在 本 正中， 我 们 将 解释 这 意味 着 什 么 ， 以 及 递归 肯 数 
是 如 何 执行 的 。 我 们 还 介绍 了 作为 问题 求解 方法 的 递归 思想 。 在 下 一 他 中， 我 们 将 应 用 递归 
思想 以 及 展示 如 何 开 发 递归 男 数 。 


10.1.1 调用 目 身 的 函数 
下 面 是 一 个 例子 ， 它 说 明了 函数 调用 日 映 的 含义 : 


模块 : ch10.py 


1 def countdown(n): 
print (n) 
countdown (n-1) 


在 函数 countdown( ) 的 实现 代码 中 ， 调 用 了 郴 数 countdown()。 因 此 函数 
countdown( ) 调用 目 身 。 当 一 个 盟 数 调用 目 身 时 ， 我 们 称 之 为 递归 调用 。 
我 们 通过 跟踪 函数 调用 countdown (3) 来 理解 该 图 数 的 行为 : 
e 当 我 们 执行 countdown(3) 时 ， 打 印 输入 参数 3， 然 后 输入 参数 减 1( 即 3-1=2) 
后 调用 countdown( )。 屏 幕 上 输出 了 了 3， 然后 我 们 继续 跟踪 countdown(2) 的 


执行 。 

e 当 我 们 执行 countdown(2) 时 ， 打 印 输入 参数 2， 然 后 输入 参数 减 1( 即 2-1=1 ) 
后 调用 countdown()。 屏 各 上 输出 了 了 2， 然后 我 们 继续 跟踪 countdown(1) 的 
执行 。 


e 当 我 们 执行 countdown(1) 时 ， 打 印 输 入 参数 1， 然后 输入 参数 减 1 ( 即 1-1=0) 


后 调用 countdown()。 屏 人 莫 上 输出 了 1， 然后 我 们 继续 跟 踊 countdown(0) 的 
执行 。 

e 当 我 们 执行 countdown (0) 时 ， 打 印 输 入 参数 0， 然 后 输入 参数 减 1 ( 即 0-1=-1 ) 
后 调用 countdown( ) 。 屏 幕 上 输出 了 0， 然 后 我 们 继续 跟 蹊 countdown(-1) 的 
执行 。 

e 当 我 们 执行 countdown (-1) 时 .…… 

看 起 来 执行 永远 不 会 终止 。 我 们 验证 如 下 : 


>>> countdown (3) 


阴 数 的 行为 是 从 原始 输入 数 开 始 倒 计数 。 如 果 让 函数 countdown(3) 执行 一 会 儿 ， 
结 采 十 : 


-973 
-974 
Traceback (most recent call last): 
File "<pyshell#2>", line 1, in <module> 
countdown (3) 
File "/Users/mne/chi0 .pyY"... 
countdown (n-1) 


接着 显示 许多 行 错误 信息 ， 最 后 的 结 来 信息 为 : 
RuntimeError: maximum recursion depth exceeded 


好 吧 ， 程 序 执行 的 确 将 永远 持续 下 去 ， 但 是 Python 解释 器 停止 了 它 。 我 们 将 解释 为 什 
么 Python VM 会 这 么 做 。 现 在 要 理解 的 要 点 是 递归 因数 将 永远 调用 目 己 ， 除 非 我 们 修改 天 


10.1.2 “停止 条 件 
为 了 证 明 这 一 点 ,假设 我 们 想 要 实现 的 countdown( ) 函数 的 行为 如 下 所 示 : 


>>> countdown(3) 
总 

了 

1 

Blastoff!!! 


或 者 


>>> countdown (0) 
Blastoff!!1! 


假设 希望 函数 countdown ( ) 从 给 定 输入 参数 n 开始 倒 计 数 到 0。 当 到 达 0 时 ， 输 出 信 
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息 “Blastoffl11”s 
要 实现 这 个 版 本 的 countdown( ) ,我 们 考虑 基于 输入 参数 n 的 值 的 两 种 情况 。 当 输入 
参数 n 是 0 或 负数 时 ,我 们 需要 输出 “Blastoff!!!”， 
def countdown(n): 
， 倒 计 数 到 0 ， 
TB = 0: # 基本 情况 
printt'Blastoffs 1") 
else: 
. # 函数 的 剩余 代码 
我 们 把 这 种 情况 称 为 递归 的 基本 情况 ， 这 是 确保 递归 晒 数 不 会 永远 调用 自己 的 条 件 。 
第 二 种 情况 为 输入 n 是 正 数 。 在 这 种 情况 下 ， 执 行 的 操作 保持 不 变 : 
print (n) 
countdown (n-1) 


上 述 代 人 码 如 何 实现 当 n>0 时 函数 countdown( ) 的 功能 ”代码 中 使 用 的 观点 如 下 : 从 n 
( 正 数 ) 倒 计 数 ， 可 以 先 打 印 n， 然 后 从 n 一 1 倒 计 数 。 此 代码 片段 被 称 为 递归 步骤 。 
解决 了 这 两 种 情况 后 ， 我 们 得 到 了 递归 果 数 : 


模块 : ch10.py 


! def countdown(n) : 


， 从 n 倒 计数 到 0 ， 


i nn «= OQ # 基本 情况 
print('Blastoff!!!') 
else: # n > 0: 说 归 步 又 
print (n) # 首先 打印 n 
countdown(n-1) # 然后 从 n-1 倒 计 数 到 0 
# 谤 归 地 


10.1.3 递归 函数 的 特性 

一 个 会 终止 的 递归 上 盟 数 包括 如 下 特性 : 

1. 一 个 或 多 个 基本 情况 ， 为 递归 提供 停止 条 件 。 在 了 滑 数 countdown() 中 ， 基 本 情况 
是 条 件 n 三 0， 其 中 是 输入 参数 。 

2. 一 个 或 多 个 递归 调用 ， 相 对 于 输入 参数 ， 其 输入 参数 必须 “更 接近 ”基本 情况 。 在 
国 数 countdown( ) 中 ， 唯 一 的 递归 调用 基于 -1， 相 对 于 输入 参数 站 “更 接近 ”基本 
情况 。 

“更 接近 ”的 含义 取决 于 递归 图 数 解决 的 问题 。 其 思想 是 ， 每 一 个 递归 调用 都 应 该 在 
与 基本 情况 更 接近 的 问题 输入 参数 上 进行 ， 这 将 确保 递归 调用 最 终 到 达 停 止 执 行 的 基本 
情况 。 

在 本 小 节 的 剩余 部 分 和 下 一 小 节 中 ， 我 们 将 给 出 更 多 的 递归 示例 。 我 们 的 目标 是 学 习 如 
何 开发 递归 困 数 。 为 此 ， 震 要 学 习 如 何 递归 地 思考 ， 也 就 是 说 ， 如 何 将 问题 的 解决 方案 描述 
为 其 于 问题 的 解决 方案 。 为 什么 我 们 要 这 么 及 烦 ?” 毕 竟 困 数 countdown( ) 本 来 可 以 用 和 迭 
代 轻 松 实现 (请 读者 尝试 ! )。 事 实 是 ,递归 函数 提供 给 我 们 一 个 方法 ， 可 以 替代 第 5 章 的 过 
代 方 法 。 对 于 一 些 问题 ， 这 种 奉 代 的 方法 实际 上 更 容易 ， 有 时 是 非常 容易 的 方法 。 例 如 ， 当 
你 开始 编写 搜索 网 页 的 程序 时 ， 你 会 很 感激 掌握 了 递归 方法 。 


10.1.4 递归 思想 


我 们 使 用 递归 的 思想 开发 递归 冰 数 vertical( )， 诗 一 个 非 负 的 整数 作为 输入 参数 ， 
从 高 位 到 低位 依次 输出 其 各 位 数字 ， 午 直 排 列 。 例 如 : 


>>> Vertical(3124) 
3 
1 
2 
4 


为 了 将 vertical() 开发 为 递归 浮 数 ,我 们 需要 做 的 第 一 件 事 是 决定 递归 的 基本 情况 。 
这 通常 是 通过 回答 一 个 问题 来 实现 的 : 何 时 垂直 输出 数 会 比较 容易 ?对 于 什么 样 的 非 负 数 ? 

如 果 输 入 的 nn 只 有 一 个 个 位 数 问题 最 容易 解决 。 在 这 种 情况 下 ,我们 只 需要 输出 n 
本 号 : 


>>> Vertical(6》 
6 


因此 我 们 确定 了 基本 情况 为 w<10。 我 们 开始 实现 曙 数 vertical( ): 


def verticalL(n) : 


， 垂直 输出 的 各 位 数字 ， 


if n < 10: # 基本 情况 : n 只 有 一 位 
Print(ny) # 就 直接 输出 n 
else: # 谤 归 步 骤 : n 有 两 个 及 以 上 的 数位 


# 函数 的 剩余 代码 

当天 小 于 10〈 即 到 只 有 一 位 ) 时 ， 国 数 vertical() 输出 2。 

确定 了 基本 情况 之 后 ， 我 们 考虑 输入 为 两 位 数 或 多 位 数 的 情况 。 在 这 种 情况 下 ， 我 们 
将 把 垂直 输出 数字 的 问题 分 解 为 “更 简单 的 ” 子 问题 ,包括 牌 直 输 出 比 n“ 更 小 ”的 数 。 
在 这 个 问题 中 ,“ 更 小 ”应 该 更 接近 于 基本 情况 (一 位 数字 )。 这 就 意味 着 递归 调用 必须 在 比 
n 位 数 更 少 的 数 上 进行 。 

分 析 结 果 可 以 引出 以 下 算法 : 由 于 nn 至少 有 两 位 数字 ， 所 以 我 们 分 解 问题 : 

a. 移 除 半 的 最 后 一 位 数 后 垂直 输出 。 这 个 数 “更 小 "， 因 为 其 位 数 少 一 位 。 对 于 宗 = 
3124， 这 意味 着 在 312 上 调用 郴 数 vertical( )。 

b. 输出 最 后 一 位 数 。 对 于 = 3124， 这 意味 着 输出 4。 

最 后 要 确定 的 是 计算 用 的 数学 公式 : (1) 求 n 的 最 后 一 位 数字 ;( 2 ) 求 去 掉 最 后 一 位 数 
字 的 数 。 求 最 后 一 位 数 可 以 使 用 余数 运算 符 (%): 


> 下 革 3 二 24 


>5% mMN1O 

4 

“ 移 除 ”nn 的 最 后 一 位 数 可 以 使 用 整数 除法 运算 符 (/ 7): 
>>> n//10 

S12 


基于 上 述 思 考 的 所 有 片断 ， 我 们 可 以 编写 如 下 完整 的 递归 函数 : 


模块 : ch10.py 


def vertical(n).: 


wy 千 10 章 


1 Wef vertical(n): 


， 垂直 输出 n 的 各 位 数字 ， 


3 4 # 基本 情况 : n 只 有 一 位 
print (n) # 就 直接 输出 nn 
else: # 递归 步骤 : n 有 两 个 及 以 上 的 数位 
vertical(n//10) # 说 归 打 印 除 了 最 后 一 位 数字 的 其 他 所 有 数字 
print (n410) # 打印 n 的 最 后 一 位 数字 


信和 le 且 图 实现 递归 函数 reverse()， 带 一 个 非 负 整 数 作为 输入 参数 ， 重 直 输 出 
其 数字 ， 从 低位 到 高 位 依次 输出 其 各 位 数字 。 
>>> reverse(3124) 


4 


2 
3 


我 们 总 结 递归 解决 该 问题 的 过 程 : 

1. 首先 确定 问题 的 基本 情况 (或 者 无 须 递 归 就 可 以 直接 解决 的 情况 )。 

2. 人 确定 如 何 把 问题 分 解 为 一 个 或 多 个 更 接近 基本 情况 的 子 问题 ， 子 问题 通过 递归 的 方法 
解决 。 利 用 子 问题 的 求解 方案 构造 原始 问题 的 求解 方案 。 

用: 和 攀 本 到 [9 居 使 用 递归 思想 实现 递归 函数 cheers()， 带 一 个 整数 nn 作为 输入 参数 ， 
输出 五 个 字符 串 'Hip '， 后 跟 'Hurray!l!l!1'。 


>>> cheers(0) 

Hurray!l!! 

>>> cheers(1) 

Hip Hurray!!! 

>>> cheers(4) 

Hip Hp Hip Hp Burray!!! 

递归 的 基本 情况 应 该 是 n= 0， 此 时 函数 输出 'Hurray!!!1'。 当 n>1 时， 范 数 应 该 输 
出 'Hip'， 然 后 在 输入 参数 1-1 上 递归 调用 自身 。 


i 对 16 时 在 第 5 章 ， 我 们 使 用 迭代 的 方法 实现 了 兄 数 factorial()。 很 显然 ， 
阶乘 函数 nl 的 递归 定义 如 下 : 


] n=0 
Ml 
n:(n—l)! n>0 


使 用 递归 重新 实现 函数 factorial()。 同 时 ， 对 于 某 个 输入 值 n > 0， 请 估计 调用 了 
多 少 次 函数 factorial()。 


10.1.5 ”递归 函数 调用 和 程序 栈 

在 使 用 递归 练习 解决 问题 之 前 ， 我 们 继续 仔细 研究 递归 所 数 执行 时 会 发 生 什么 。 这 样 做 
可 以 帮助 我 们 认识 到 递归 确实 起 作用 了 。 

我 们 讨论 当 输 入 n = 3124 时 执行 函数 vertical() 时 发 生 了 什么 。 在 第 7 章 中 ， 我 们 
讨论 了 和 名称 空间 和 程序 栈 如 何 支持 函数 调用 以 及 程序 的 正常 控制 流程 。 图 10-1 显示 了 执行 
vertical(3124) 时 ， 递 归 函 数 的 执行 顺序 、 关 联 的 名 称 空间 和 程序 栈 的 状态 。 


模块 : ch10.py 


def vertical(n): 


”垂直 输出 nm 的 各 位 数字 ， 












i 0: # 基本 情况 : n 只 有 一 位 
print (n) # 就 直接 输出 n 
else: # 说 归 步 驰 : n 有 两 个 及 以 上 的 数位 
Vertical(n//10) # 说 归 打 印 除 了 最 后 一 位 数字 的 其 他 所 有 数字 
print (n%10) # 打印 n 的 最 后 一 位 数字 
| 1 | | 
! vertical(3124) ! vertical(312) , vertical(31) ,vertical(3) 
| 的 执行 ' 的 执行 (的 执行 ! 的 执行 
| 1 | 1 
A I a 
| ' [Mine7 | ， | /line7 
vertical(3124) n = 3124| ， ln=3t2| ， [/n=31 
程序 栈 | 
n = 3124 二 32 1 
vertical(312) 程序 栈 
| 区 = 3124 
i 程序 栈 


vertical(31) 






| | 
) | n = 3124 n = 3124 
程序 栈 程序 栈 程序 栈 


图 10-1 递归 函数 执行 。vertical(3124) 在 一 个 名 称 空 间 中 执行 ， 其 中 为 3124。 在 
调用 vertical(312) 之 前， 名 称 空间 中 的 值 3124 和 要 执行 的 下 一 行 代 人 码 (第 7 
行 ) 存储 在 程序 栈 。 然 后 在 一 个 新 的 名 称 空间 中 执行 vertical(312)， 其 中 为 
312。 在 递归 调用 vertical(31) 和 vertical(3) 之 前 ， 同 样 会 增加 栈 帧 。 调 用 
vertical(3) 在 一 个 新 的 名 称 空间 中 执行 ， 其 中 为 3， 输出 3。 当 vertical(3) 
终 目 后， 恢复 vertical(31) 的 名 称 空间 : nn 为 31， 第 7 行 的 语句 print(n%10) 
输出 1。 同 样 , 恢复 vertical(312) 和 vertical(3124) 的 名 称 空间 


图 10-1 和 第 7 章 的 图 7-5 的 执行 流程 的 区 别 在 于 : 在 图 10-1 中 ,调用 同一 个 馈 
数 一 一 曙 数 vertical() 调用 vertical()， 有 再 递归 调用 vertical()， 上 再 递归 调用 
vertical()。 在 图 7-5 中 ， 困 数 f() 调 用 g()， 而 g() 调 用 h()。 因 此 ， 图 10-1 强调 
名 称 空间 与 每 个 男 数 调用 相关 联 ， 而 不 是 与 困 数 本 喘 相 关联 。 
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10.2 ”递归 示例 


在 前 一 节 中 ， 我 们 介绍 了 递归 以 及 如 何 使 用 递归 思想 解决 问题 。 我 们 使 用 的 问题 并 没有 
真正 展示 递归 的 强大 : 每 个 问题 都 可 以 很 容易 地 用 迭代 来 解决 。 在 这 一 节 中 ， 我们 讨论 使 用 
递归 能 够 更 容易 解决 的 问题 。 


10.2.1 递归 数列 模式 


我 们 首先 实现 阴 数 pattern()， 带 一 个 非 负 整数 nn 作为 输入 参数 ， 输 出 一 个 数值 
模式 : 


>>> pattern(0) 


>>> pattern(1) 

日 计划 

>>> Pattern(2) 

9 

>>> Pattern(3) 

+ 

>>> pattern(4) 

全 020 O00Q0 和 L020 


怎么 知道 这 个 问题 应 该 递归 地 解决 呢 ?” 验 证 前 ， 我 们 无 法 确认 。 我 们 需要 尝试 它 ， 看 看 
它 是 否 有 效 。 首 先 来 确定 基本 情况 。 基 于 所 给 出 的 例子 ， 我 们 可 以 决定 的 基本 情况 为 : 输入 
参数 环 为 0， 这 种 情况 下 四 数 pattern() 应 该 打印 0。 首 先 实现 如 下 的 困 数 : 

def pattern(n): 

' 打印 第 n 个 模式 ' 
if n == 0: 
print (0) 


else: 


# 函数 的 剩余 代码 
接 下 来 需要 描述 对 于 正 整 数 输 入 参数 n 阴 数 pattern() 的 行为 。 我 们 观察 
pattern(3) 的 输出 ， 例 如 : 


>>> pattern(3) 
4 


把 上 述 结 果 与 pattern(2) 的 输出 做 比较 : 


>>> pattern(2) 
人 


如 图 10-2 所 示 ，pattern(2) 的 输出 在 pattern(3) 的 输出 中 出 现 了 2 次 而 不 是 


pattern(3) 5 
pattern(2) pattern(2) 


图 10-2 pattern(3) 的 输出 结果 。pattern(2) 的 输出 结果 出 现 了 2 次 


看 起 来 好 像 pattern(3) .的 正确 输出 可 以 通过 调用 因数 pattern(2)， 输 出 3， 然 后 
冉 贡 用 pattern(2) 获得 。 在 图 10-3 中 ， 我 们 描述 了 pattern(2) 和 pattern(1l) 输 
出 的 类 似 行 为 。 


pattern(2) QLD Q10 
pattern(1) pattern(1) 


pattern(1) 0 0 





pattern(0) pattern(0) 


图 10-3 pattern(2) 和 pattern(1) 的 输出 结果 。pattern(2) 的 输出 结果 可 以 通过 
pattern(1) 的 输出 结果 获得 。pattern(1) 的 输出 结果 可 以 通过 pattern(0) 的 
输出 结果 获得 


一 般 来 说 ，pattern(n) 的 输出 是 通过 执行 pattern(n-1)， 输出 的 值 ， 然 后 再 执 
行 pattern(n-1) 获得 : 
..，# 函数 的 基本 情况 
else 
pattern(n-1) 
print(n) 
pattern(n-1) 


让 我 们 尝试 运行 实现 的 函数 : 
>>> pattern(1) 
0 


0 


基本 上 实现 了 程序 的 功能 。 为 了 在 一 行 中 输出 结果 ， 我 们 需要 将 每 次 输出 结果 保持 在 同 
一 行 中 。 所 以 最 终 的 解决 方案 是 : 


模块 : ch10.py 
def pattern(n): 


' 打印 第 nn 个 模式 ， 

if n == 0: # 基本 情况 
print (0, end=' ') 

else: # 说 归 步 骤 . n > 0 
pattern(n-1) # 打印 第 n -1 个 模式 
print (n, end=" ‘') # 打印 n 
pattern(n-1) # 打印 第 n -1 个 模式 





实现 递归 函数 pattern2()， 带 一 个 非 负 整数 作为 输入 参数 ， 输 出 如 
下 所 示 的 模式 。 对 于 输入 0 和 1， 分 别 仅 输出 一 个 星 号 : 


>>> pattern2(0) 
>>> pattern2(1) 
* 


对 于 输入 2 和 3， 输 出 模式 如 下 所 示 : 


>>> pattern2(2) 
* 

冰冰 

水 

>>> Pattern2(3) 
* 
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10.2.2 分 形 图 形 


在 下 一 个 递归 示例 中 ， 我 们 同样 将 输出 一 个 模式 ,但 这 一 次 将 是 一 个 由 Turtle 图 形 
对 和 象 绘制 的 图 形 模 式 。 对 于 每 一 个 非 负 整数 n， 输 出 的 模式 将 是 一 条 被 称 为 科 赤 曲线 ( Koch 
curve) 的 曲线 K,。 例 如 ， 图 10-4 显示 了 科 赫 曲线 K;。 


图 10-4 科 赫 曲线 K;。 科 赫 曲 线 是 一 种 分 形 曲 线 ， 类 似 于 雪花 图 案 


我 们 将 使 用 递归 来 绘制 科 赫 曲 线 (例如 ，K;)。 为 了 开发 用 来 绘制 这 一 曲线 和 其 他 科 赫 
曲线 的 函数 ,我们 先 观 察 几 条 科 赫 曲线 。 科 赫 曲 线 K。、K,、K,、K; 显示 在 图 10-5 的 左 侧 。 


科 赫 曲线 海龟 指令 


Kr Ys a F 


Ki: FLFRFLF 


及 2: A FLFRFLFLFLFRFLFRFLFRFLFLFLFRFLF 


Ks: 
图 10-5 ”和 市 绘图 指令 的 科 赫 曲线 。 在 左 侧 ， 从 上 到 下 是 科 赫 曲线 KK,、K,、K,、K;。 图 中 还 显示 
了 科 赫 曲线 Ku、K, 和 天 的 绘图 指令 。 指 令 是 用 字母 F、E 和 RR 来 编码 的 ， 分别 对 应 
于 “向 前 移动 ”“ 回 左旋 转 60 度 ” 和 “向 右 旋转 120 度 ” 


如 末 仔 细 查 看 这 些 模式 ， 你 可 能 会 注意 到 每 条 科 赫 曲线 K; (对 于 i>0) 都 包含 了 科 赫 曲 
线 K 的 几 个 副本 。 例 如 ， 曲 线 K, 包含 曲线 天 的 四 个 〈 较 小 版 本 的 ) 副本 。 
更 确切 地 说 ， 绘 制 科 赫 曲线 KK,，Turtle 图 形 对 象 应 该 遵循 如 下 指令 : 
.绘制 科 赫 曲线 K; 
. 回 左旋 转 60 度 ; 
. 绘制 科 赫 曲线 Ki; 
回 右 旋转 120 度 ; 
绘制 科 赫 曲线 K; 
回 左 旋转 60 度 ; 
绘制 科 夫 曲线 K,。 


注意 ， 这 些 指令 是 递归 描述 的 。 这 表明 我 们 需要 做 的 是 开发 一 个 递归 晴 数 koch(n ) ， 
审 一 个 非 负 整数 n 作为 输入 参数 ， 并 返回 一 系列 指令 ，Turtle 对 象 使 用 这 些 指 令 绘制 科 替 
曲线 。 指 令 可 以 被 编码 为 包含 字母 F、L 和 RR 的 字符 串 ， 分 别 对 应 于 “ 回 前 移动 ”“ 向 左旋 转 
60 度 ” 和 “向 右 旋 转 120 度 ” 的 指令 。 人 例如， 绘制 科 赫 曲线 Ku、 曲 线 K 和 K, 的 指令 如 图 
10-5 所 示 。 了 因数 koch( ) 的 运行 结果 如 下 所 示 : 


>>> koch(0) 

IF， 

>>> koch(1) 

IFLFRFLEF， 

>>> koch(2) 
'FLFRFLFLFLFRFLFRFLFRFLFLFLFRFLF ' 


基于 上 述 观 察 结 果 ， 接 下 来 将 通过 开发 使 用 绘制 曲线 K 来 绘制 曲线 K, 领悟 的 思想 ， 理 
解 绘制 曲线 K, 的 指令 (调用 盟 数 koch (2) 的 计算 结果 ) 如 何 使 用 绘制 曲线 K 的 指令 ( 调 
用 清 数 koch(1) 的 计算 结果 ) 来 获得 。 如 图 10-6 所 示 ， 绘 制 曲线 天 的 指令 在 绘制 曲线 K。 
的 指令 中 出 现 了 四 次 : 


koch(2) FLFRFLF |, L | FLFRFLF R FLFRFLF ，L FLFRFLF 
koch(1) koch(1) koch (1) koch(1) 


图 10-6 koch(2) 的 输出 结果 。koch(1) 可 以 用 来 构造 Koch (2 ) 的 输出 


同样 ， 绘 制 曲 线 K 的 指令 ( koch(1) 的 输出 ) 包含 绘制 曲线 K, 的 指令 (koch(0) 的 
输出 )， 如 图 10-7 所 示 。 


koch(1) F LE F R F F 
koch (0) koch (0) koch (0) koch (0) 


图 10-7 koch(1) 的 输出 结果 。koch (0) 可 以 用 来 构造 koch (1 ) 的 输出 


接 下 来 我 们 可 以 使 用 递归 方法 实现 困 数 koch( ) 。 基 本 情况 对 应 于 输入 0， 此 时 函数 仅 
从 出 指令 'F 
def koch(n): 
if n == 0: 
return 'F' 


# 函数 的 剩余 代码 

对 于 输入 n > 0， 我们 总 结 如 图 10-6 和 图 10-7 的 观察 结果 ，koch(n) 的 输出 应 该 为 如 
下 字符 串 拼 接 结 采 : 

koch(n-1) + 'L' + koch(n-1) + 'R' + koch(n-1) + 'L' + koch(n-1) 

于 是 函数 koch() 定义 如 下 : 

def koch(n) : 


if n == 0: 


return 'F， 
return Koch(n-=1) + 人 5 + koch(n=1) + RT Koch(n=1) + LN 
koch (n-1) 


如 有 条 测试 这 个 盟 数 ， 你 会 发 现 结果 正确 。 然 而 ， 这 种 实现 存在 效率 问题 。 在 最 后 一 行 ， 
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我 们 针对 同一 个 输入 调用 了 四 次 困 数 koch( )。 当 然 ， 每 次 返回 的 值 (指令 ) 是 相同 的 。 这 
种 实现 方法 非常 痕 费 资源 。 
注意 事项 : 避免 重复 相同 的 递归 调用 

通常 ， 一 个 递归 的 解决 方案 最 自然 的 描述 方法 是 使 用 几 个 相同 的 递归 调用 ， 正 如 我 们 
刚刚 在 递归 函数 koch() 中 所 示 。 作 为 在 同一 个 输入 上 重复 调用 相同 的 函数 的 替代 ， 我 
们 可 以 调用 一 次 ， 然 后 多 次 重复 使 用 它 的 输出 结果 。 

国 数 koch() 的 更 好 实现 代码 如 下 : 

模块 : ch10.py 


def koch(n): 
' 返回 绘制 科 赫 曲线 koch(n) 的 海龟 指令 ， 


4 i = Os # 基本 情况 


Teburn FF' 


tmp = koch(n-1) # 递归 步骤 : 获取 科 赫 曲线 koch(n-1) 的 指令 
# 并 用 其 构造 科 赫 曲线 koch (n) 的 指令 


raturn tmp 二 
我 们 最 后 要 做 的 工作 是 开发 一 个 函数 ， 基 于 函数 koch( ) 返回 的 指令 ,使 用 海龟 图 形 
对 象 绘制 相应 的 科 夫 曲线。 代码 如 下 : 
模块 : ch10.py 


+ from turtle import Screen, Turtle 
def drawKoch(n): 
3 ' 使 用 koch() 函数 指令 绘制 第 n 阶 科 赫 曲线 ， 
s = Screen() # 创建 屏幕 
€ ms Ta) # 创建 海龟 
directions = koch(n) # 获取 绘制 科 赤 曲线 Koch(n) 的 指令 


for move in directions: # 对 于 指定 的 移动 


10 if move == 'F': 
1 t.forward(300/3**n) # 向 前 移动 ， 对 长 度 规范 化 
12 if move == 'L': 
13 t.1t(60) # 向 左旋 转 60 度 
14 if move == 'R': 
bbl120) # 疝 右 旋转 120 度 
s.bye() 


我 们 进一步 解释 第 11 行 代 码 。 值 300/3**n 是 海 包 向 前 移动 的 长 度 。 它 取决 于 nn 的 
值 ， 因此, 不管 n 的 值 是 什么 科 赫 曲线 的 宽度 为 300 像素 ， 并 适应 屏幕 。 请 检查 n 等 于 0 
和 1 的 情况 。 
知识 拓展 : 科 赫 曲线 和 其 他 分 形 图 形 
科 赫 曲线 K, 在 1904 年 由 瑞典 数学 家 海里 格 ， 冯 ， 科 页 (Helge von Koch) 发 表 的 论 
文中 首先 提出 。 他 对 当 n 趋向 于 %w 时 得 到 的 曲线 玉 - 特 别 感 兴趣 。 


科 赫 曲线 是 分 形 图 形 的 一 个 例子 。 分 形 图 形 ( fractal) 一 词 由 法 国 数学 家 本 华 . 曼 德 
布 洛 特 (Benoit Mandelbrot) 于 1975 年 发 明 ， 指 代 有 具有 下 列 特征 的 曲线 : 

。 形状 “分 段 ” 而 不 是 平滑 ; 

。 自 我 相似 ( 即 在 不 同 的 放大 倍数 下 它们 看 起 来 是 一 样 的 ); 

。 可 以 自然 地 使 用 递归 来 描述 。 

物理 的 分 形 (通过 递归 的 物理 过 程 而 形成 ) 出 现在 自然 界 中 ,例如 雪花 、 冷 玻璃 上 
的 冰晶 体 、 闪 电 、 云 、 海 岸 线 和 河流 系统 、 菜 花 和 西 兰 花 、 树 和 蕨 类 植物 、 血 液 和 肺 
血管 。 


实现 函数 snowflake()， 市 一 个 非 负 整数 n 作为 输入 参数 ， 按 下 列 方 
Pe 以 输出 一 个 雪花 模式 : 当 海龟 图 形 对 象 完 成 绘制 第 一 条 科 赫 曲线 后 ， 
海龟 旋转 120 度 后 绘制 第 二 条 科 赫 曲线 ， 海 龟 向 右 旋转 120 度 绘制 第 三 条 科 赫 曲线 。 下 图 显 
示 了 snowflake(4) 的 输出 结果 : 


10.2.3 ”病毒 扫描 


我 们 现在 使 用 递归 开发 一 个 病毒 扫描 程序 ， 即 一 个 系统 地 检查 文件 系统 中 的 每 一 个 文件 
并 打印 包含 已 知 计算 机 病毒 特征 的 文件 名 称 的 程序 。 病 毒 特征 ( virus signature) 是 一 个 特定 
的 字符 串 ， 它 是 文件 中 病毒 存在 的 证 据 。 


知识 拓展 : 病毒 和 病毒 扫描 程序 

计算 机 病毒 是 一 个 小 程序 ， 通 常 在 用 户 不 知情 的 情况 下 ， 附 加 或 合并 到 驻 留 在 用 户 的 
计算 机 的 文件 中 ， 当 病毒 执行 时 会 对 计算 机 造成 伤害 。 例 如 ， 计 算 机 病毒 可 能 会 破坏 或 表 
除 计算 机 上 的 数据 。 

病毒 是 一 种 可 执行 程序 ， 就 像 其 他 程序 一 样 ， 作 为 字 节 序列 被 存储 在 一 个 文件 中 。 如 
果 计 算 机 病毒 由 计算 机 安全 专家 识别 并 获知 其 字 节 序列 ， 那 么 检查 文件 是 否 包含 病毒 所 需 
做 的 全 部 工作 是 检查 该 字 节 序列 是 否 出 现在 文件 中 。 事 实 上 ， 寻 找 完整 的 字 节 序列 并 不 是 
必需 的 ， 搜 索 这 个 序列 中 精心 挑选 的 片段 足以 高 概率 地 识别 病毒 。 这 个 片段 被 称 为 病毒 特 
征 : 它 是 病毒 代码 中 出 现 的 字 节 序列 ， 但 不 太 可 能 出 现在 未 感染 的 文件 中 。 

病毒 扫描 程序 周期 性 地 、 系 统 地 扫描 计算 机 文件 系统 中 的 每 个 文件 ， 并 检查 它们 是 否 
感染 了 病毒 。 病 毒 扫描 程序 包含 一 个 病毒 特征 列表 ， 并 且 会 定期 自动 更 新 。 程 序 检查 每 个 
文件 是 否 存在 列表 中 的 某 些 病毒 特征 ， 如 果 文件 包含 病毒 特征 ， 则 对 其 进行 标记 。 


我 们 使 用 字典 来 存储 各 种 病毒 特征 。 它 把 病毒 名 称 映射 到 病毒 特征 : 
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>>> signatures = {'Creeper':'ye8009g2hlazzx33 ' ， 
Code Red':'99dhicz963bsscs3',， 
'Blaster':'fdp1i102kiks6hgbc '} 


(虽然 字典 中 的 名 称 是 真实 的 病毒 名 称 ， 但 病毒 特征 是 虚假 的 。) 

病毒 扫描 函数 带 两 个 输入 参数 : 病毒 特征 字典 和 父 文 件 夹 或 文件 的 路 径 〈 字 符 串 )。 
程序 访问 父 文 件 夹 及 其 子 文件 夹 ( 子 文件 夹 中 的 子 文件 夹 ， 以 此 类 推 ) 中 的 每 个 文件 。 
图 10-8 显示 了 一 个 示例 文件 夹 “ test” 以 及 它 直 接 或 则 接 包 含 的 所 有 文件 和 子 文件 来 。 病 
毒 扫 描 程 序 将 访问 图 10-8 中 的 每 个 文件 ， 并 输出 如 下 所 示 的 结 末 : 

>>> scan('test', signatures) 

test/fileA.txt, found virus Creeper 

test/folder1i/fileB.txt, found virus Creeper 

test/folderi/fileC.txt, found virus Code Red 

test/folder1i/folder1i1/fileD.txt, found virus Code Red 


test/folder2/fileD.txt, found virus Blaster 
test/folder2/fileE.txt, found virus Blaster 


test | 


folderl fleA.txt folder2 
fileB.txt fileC.txt folderll fileD.txt fileE.txt 
fileD.txt 


图 10-8 ”文件 系统 片段 。 其 中 显示 了 文件 夹 “test” 及 其 下 的 所 有 子 文件 夹 和 文件 


由 于 一 个 文件 系统 的 递归 结构 (一 个 文件 夹 包含 文件 和 其 他 文件 夹 )， 我 们 使 用 递归 开 
发 病毒 扫描 函数 scan( )。 当 输入 路 径 名 是 一 个 文件 的 路 径 名 时 ， 哨 数 应 该 打开 和 读 取 文件 
内 容 ， 并 查找 文件 中 是 否 包 含 病 毒 特征 码 ， 这 是 基本 情况 。 当 输入 路 径 名 是 一 个 文件 夹 的 路 
径 名 时 ，scan( ) 应 该 在 输入 文件 夹 中 的 每 个 文件 和 子 文件 夹 上 递归 调用 自嘲， 这 是 递归 步 
又 。 完 整 的 实现 代码 如 下 : 


模块 : ch10.py 


+ import os 

def scan(pathname, signatures): 
3 '，'， 扫描 路 径 名 ,或 者 如 果 路 径 是 一 个 文件 夹 ， 则 扫描 
4 该 文件 夹 下 直接 或 间接 包含 的 所 有 文件 ，'， 

if os.path.isfile(pathname): # 基本 情况 : 扫描 路 径 名 

6 infile = open(pathname) 
content = infile.read() 
infile.close() 


10 for virus in signatures: 

1 # 检查 content 中 是 否 出 现 病 毒 特征 

12 if content.find(signatures[virus]) >= 0: 

13 print('{}, found virus {}'.format(pathname, virus)) 
14 return 


16 # 路 径 名 是 文件 夹 ， 则 递归 对 该 文件 夹 下 的 每 一 项 扫描 
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for item in os.listdir(pathname): 


# 为 当前 工作 路 径 相关 的 项 
# 创建 路 径 名 


# fullpath = Pathname + '/' + item # Mac 操作 系统 
# fullpath = pathname + '\' + item # Windows 操作 系统 
fullpath = os.path.join(pathname, item) # 任意 操作 系统 


scan(fullpath, signatures) 


程序 使 用 了 标准 库 模 块 os 中 的 函数 。 模 块 os 包含 了 对 操作 系统 资源 (例如 文件 系统 ) 
提供 访问 的 函数 。 我 们 使 用 了 如 下 三 个 os 模块 哨 数 : 

a.listdir()。 函 数 带 一 个 输入 参数 : 一 个 文件 夹 的 绝对 路 径 或 相对 路 径 (字符 串 )， 
返回 输入 文件 夹 中 的 所 有 文件 和 子 文件 夹 。 

b.path.isfilel()。 上 图 数 带 一 个 输入 参数 : 一 个 文件 夹 的 绝对 路 径 或 相对 路 径 (字符 
串 )， 如 果 路 径 指 同一 个 普通 文件 ， 则 返回 True， 和 否则 返回 False。 

c.path.join()。 带 两 个 路 径 作 为 输入 参数 ， 把 它们 合并 成 一 个 新 的 路 径 (根据 需要 
插入 \ 或 /) 并 返回 新 路 径 。 

我 们 进一步 解释 为 什么 需要 第 三 个 图 数 。 图 数 1istdir() 返 回 的 不 是 一 个 路 径 列 
表 ， 而 是 一 个 文件 和 子 文件 夹 名 称 列表 。 例 如 ， 当 我 们 开始 执行 scan('test' ) (省 略 了 
scan() 的 第 二 个 参数 ) 时 ， 郴 数 1istdir( ) 的 调用 如 下 : 


> vs.l1itair( Gost’) 
Llol, trt', "foldari', "foldora’)| 


如 果 我 们 递归 调用 scan('folderl')， 则 当 该 图 数 调 用 开始 执行 时 ， 困 数 
listdir() 将 在 路 径 'folder1' 上 调用 ， 结 果 出 错 : 


>>> os.listdir(t'folderti'") 
Traceback (most recent call last): 
File "<pyshell#387>", line 1, in <module> 
os.listdir('folder1') 
OSError: [Errno 2] No such file or directory: 'folderl， 


问题 是 执行 scan( 'test' ) 过 程 中 当前 路 径 是 包含 文件 夹 test 的 文件 夹 ， 其 中 不 存 
在 文件 夹 'folder1' ， 因 而 出 错 。 

为 了 取代 畏 数 调用 scan( 'folder1')， 我 们 需要 在 一 个 绝对 路 径 或 是 相对 于 当前 工 
作 目 录 的 相对 路 径 上 调用 scan( ) 困 数 。 按 照 下 列 方式 拼接 'test' 和 'folderl'， 可 以 
获得 ' folder1l' 的 路 径 : 

0 
(在 Windows 系统 上 )， 或 者 更 一 般 地 ， 按 照 下 列 方式 拼接 pathname 和 item: 

path = pathname + '\' + item 

上 述 代 码 在 Windows 机 需 上 可 以 正常 工作 ,但 在 UNIX、Linux 或 MAC OS X 机 天 上 
会 出 销 ， 因 为 在 这 些 操作 系统 上 使 用 正 斜 杠 〈/ )。 一 个 更 好 的 可 移植 的 解决 方案 是 使 用 模块 
os 中 的 果 数 path.join()。 它 适用 于 所 有 的 操作 系统 ， 因 而 与 操作 系统 无 关 。 例 如 在 一 
个 Mac 机 和 右上: 
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>>> pathname = 'test' 

>>> item = 'folderl， 

>>> os.path.join(pathname, item) 
‘test/folderl' 


相同 的 例子 在 Windows 系统 上 的 执行 结果 如 下 : 


>>> pathname = 'C://Test/virus' 
>>> item = 'folderl' 

>>> os.path.join(pathname, item) 
'C://Test/virus/folderl' 


10.2.4 线性 递归 


我 们 在 这 一 节 中 讨论 的 三 个 问题 一 一 打印 数字 序列 模式 、 绘 制 科 赫 曲线 ， 以 及 扫描 文件 
系统 查找 病毒 ， 痢 可 以 不 使 用 递归 方法 来 解决 。 这 些 问题 的 迭代 解法 确实 存在 ， 然而， 和 迭 代 
解决 方案 需要 比 递归 复杂 得 多 的 算法 ， 超出 了 计算 机 科学 导论 教科 书 的 范围 。 

为 一 方面 ， 我 们 在 10.1 节 中 讨论 的 问题 存在 简单 的 迭代 解决 方案 。10.1 节 中 的 递归 也 
数 vertical()、reverse()、cheers() 和 factorial()， 可 以 很 容易 地 使 用 迭代 方 
法 来 实现 。 事 实 上， 递归 方法 和 迭代 方法 是 密切 相关 的 。 练 习题 10.3 和 练习 题 5.4 中 的 函数 
factorial() 的 两 种 实现 方法 可 以 用 来 说 明 这 一 点 。 虽 然 一 种 实现 是 递归 方法 而 另 一 种 实 
现 是 迭代 方法 ， 但 两 个 果 数 使 用 相似 的 过 程 来 计算 呈 ! : 对 于 i= 1，…, 由 ， 它 们 都 通过 把 
前 一 个 中 间 结 果 (i-1)! 乘 以 i 来 计算 中 间 结 果 序 列 i! 。 因 此 ， 递 归 困 数 可 以 看 作 是 这 一 思 
想 的 递归 实现 。 

当 一 个 男 数 的 递归 步骤 是 使 用 一 个 递归 调用 (计算 “前 一 个 ”的 中 间 结 果 ) 和 “基本 情 
况 ” 非 递归 (具体 问题 ) 操作 来 计算 “下 一 个 ”中 间 结 果 时 ， 这 个 函数 被 称 为 使 用 线性 递归 。 
例如 ,在昌 数 vertical() 中 ,递归 步骤 包含 一 个 递归 调用 vertical(n//10) (输出 除 
最 后 一 位 数字 的 所 有 数字 ) 和 语句 print(n%10) (输出 最 后 一 位 数字 )。 

线性 递归 是 实现 基于 列表 的 函数 的 一 种 特别 有 用 的 技术 。 例 如 ， 一 个 累加 数字 列表 中 数 
值 的 因数 可 以 使 用 线性 递归 来 实现 ， 代 码 如 下 所 示 : 


模块 : ch10.py 


!' def recSum(lst): 
， 返回 列表 1st 中 各 项 之 和 ， 
if len(lst) == 0: 
4 return 0 
return recSum(lst[:-1]) + lst[-1] 


注意 ， 递 归 步 又 包含 一 个 递归 调用 (累加 列表 中 除 最 后 一 个 数值 的 所 有 数 ) 和 一 个 “ 基 
本 情况 ”操作 〈 把 最 后 一 个 数 加 到 累加 和 中 )。 


5 测 ”使 用 线性 递归 实现 函数 recNeg()， 带 一 个 数值 列表 作为 输入 参数 ， 如 
果 列 表 中 某 些 数值 为 负数 ， 则 返回 True， 否 则 返回 False，。 

>>> recNeg([3, 1, -1, 5]) 

True 


>»>> CNeg([S， 1 0 避 ) 
False 


在 下 一 个 示例 中 ， 我 们 实现 函数 recIncr( )， 带 一 个 数值 列表 作为 输入 参数 ， 返 回 列 
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表 的 一 个 副本 ， 列 表 中 的 每 个 数 都 递增 1: 


> TBt = [和 和， 0] 
>»>> PocTlner(let} 
2 0 We i 


我 们 选择 使 用 递归 方法 而 不 是 迭代 方法 实现 该 阴 数 : 


模块 : ch10.py 
' def reclIncer(laty): 
1 返回 列表 [lst[0]+1, lst[1]+1l, .。.; 1Lst[na -1]+1] ' 
if len(lst) == 0: 
return | 


return recIncr(lest[:-=1]) + [lst[=1]j+1] 


递归 步骤 由 拼接 递归 调用 的 结果 列表 和 包含 列表 最 后 一 个 值 加 1 的 列表 组 成 。 
盟 数 recIncr( ) 是 带 一 个 列表 输入 参数 并 返回 一 个 每 个 列表 项 都 执行 了 同样 操作 的 列 
副本 的 示例 。 把 列表 中 的 项 逐个 递增 1 可 能 仅仅 是 布 望 针 对 列表 项 执行 的 许多 操作 之 一 。 
因此 ， 这 有 助 于 实现 一 种 更 加 抽象 的 消 数 recMap ( ) ， 带 两 个 参数 (操作 和 列表 )， 然 后 针 
对 列表 中 的 每 个 项 应 用 该 操作 。 当 然 ,， 这 里 的 “操作 ”意味 着 一 个 水 数 。 例 如 ， 如 有 果 我 们 硕 
望 使 用 师 数 recMap( ) 递增 一 个 数值 列表 中 的 每 个 数值 ， 首 先 必须 定义 希望 应 用 到 每 个 数 
值 的 限 数 : 


>>> def f(i): 
FEGEUDIEZ 二 1 


然后 使 用 recMap() 把 函数 £ 应 用 到 列表 中 的 每 个 数值 : 


>>> recMap(lst, f£) 
Ee 4 


如 果 我 们 希望 获得 列表 1st 中 所 有 数值 的 平方 根 ， 可 以 使 用 math .sqrt 困 数 来 代 蔡 : 


>>> from math import sqgrt 
>>> recMap(lst, sqrt) 
0 


注意 ，recMap( ) 的 输入 参数 是 f£ 而 不 是 £( ) ,或 者 是 sqrt 而 不 是 sqrt( )。 这 是 因 
为 我 们 仅仅 是 传递 一 个 指 问 浮 数 对 象 的 引用 ， 而 不 是 进行 浮 数 调用 。 
可 以 使 用 线性 递归 实现 recMap( ) : 


模块 : ch10.py 
' def recMap(lst, f£): 
' 返回 列表 [£(183t[0]), £(lst{l1]), ...r 王 (Let[n =L]y] ， 
if len(lst) == 0: 
return [] 


roturi TocMant lot Ls-1], £) + LECtlatl=1})) 


知识 拓展 : 高 阶 函 数 
在 函数 zecmap() 中 ， 第 二 个 输入 参数 是 一 个 函数 。 以 另 一 个 函数 作为 输入 或 者 返 
回 函 数 的 函数 称 为 高 阶 函 数 。 把 一 个 函数 作为 一 个 值 对 待 是 一 种 程序 设计 风格 ， 在 函数 式 
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程序 设计 范式 中 被 广泛 使 用 ， 我 们 将 在 12.3 节 中 介绍 。 

Python 支持 高 阶 函 数 ， 因 为 函数 的 名 称 与 其 他 对 象 的 名 称 没 有 什么 区 别 ， 因 此 可 
以 将 其 视 为 一 个 值 。 并 非 所 有 语言 都 支持 高 阶 函数 。 其 他 一 些 支 持 高 阶 函 数 的 语言 包括 
LISP、Perl、Ruby 和 JavaScript。 


由 多 使 用 函数 zecMap() 编 写 一 个 简单 的 语句 ， 对 一 个 二 维 数值 列表 
table 中 的 行 之 和 进行 求 值 ， 结 果 保 存在 一 个 列表 中 。 


10.3 ”运行 时 间 分 析 


程序 的 正确 性 当然 是 我 们 主要 关心 的 问题 。 然 而 ， 程 序 的 可 用 性 甚至 效率 也 很 重要 。 本 
节 我 们 继续 使 用 递归 来 解决 问题 但 这 一 次 着 眼 于 效率 。 在 我 们 的 第 一 个 例子 中 ,我们 将 
递归 应 用 于 一 个 似乎 并 不 需要 它 的 问题 ， 但 结果 在 效率 上 获得 了 惊人 的 提高 。 在 第 二 个 示例 
中 ， 我 们 考虑 了 一 个 似乎 适合 递归 的 问题 ， 但 结果 得 到 了 一 个 非常 低 效 的 递归 程序 。 


10.3.1 指数 函数 
接 下 来 我 们 讨论 指数 函数 a" 的 实现 。 我 们 已 经 知道 ，Python 提供 了 求 医 运算 符 ** : 


六 光志 来 玉 人 4 
16 


但 是 ， 如 何 实现 客运 算 符 ** 呢 ? 如 果 不 存在 该 运算 符 ， 我 们 该 如 何 实现 它 ” 直接 的 方 
法 是 把 a 相 乘 款 次 。 累 加 天 模 式 可 以 用 来 实现 这 种 思想 : 


模块 : ch10.py 


! def power(a, n): 
' 返回 a 的 mn 次 医 ， 
res = 1 
for i in range(n): 
res *= a 
return res 


我 们 应 该 可 以 很 自信 地 认为 消 数 power( ) 功能 正确 。 但 这 是 实现 滑 数 power ( ) 的 最 
好 方式 吗 ? 有 没有 运行 速度 更 快 的 实现 ?很 明显 ， 响 数 power ( ) 将 执行 n 次 乘法 来 计算 
a"。 如 果 n 是 10 000， 则 需要 执行 10 000 次 乘法 。 我 们 可 不 可 以 实现 power ( ) ， 使 得 要 执 
行 的 乘法 次 数 显著 减少 ， 例 如 20 次 而 不 是 10 000 次 ? 
让 我 们 看 看 递归 方法 会 给 我 们 融 来 什么 。 我 们 要 开发 一 个 递归 函数 rpower ( ) ， 融 两 个 
输入 参数 : a 和 非 负 整数 n， 返 回 a"。 
很 显然 ,递归 的 基本 情况 是 n= 0， 此 时 a" = 1， 应 该 返回 1: 
def rpower(a, n): 
' 返回 日 的 mn 次 客 ， 
if n == 0: # 基本 情况 : n == 0 


Eeturn 1 


# 函数 的 剩余 代码 
让 我 们 处 理 递 归 步 又 。 为 此 ， 我 们 需要 把 a"(n > 0 ) 递归 地 表示 为 a 的 较 小 的 害 〈 即 “更 


接近 ”基本 情况 )。 实 际 上 这 并 不 困难 ， | 


了 Ixa 


a”"=a"”" xa” 

最 后 一 个 表达 式 的 吸引 人 之 处 是 a” 和 a” 这 两 个 项 相同 ， 因 此 通过 一 次 计算 a” 的 
递归 调用 可 以 计算 a”。 唯 一 的 问题 是 当 n 为 奇数 时 ，n/12 不 是 一 个 整数 。 让 我 们 考虑 两 种 
情况 。 

如 上 分 析 结 果 ， 当 nn 的 值 为 偶数 ,我 们 可 以 使 用 rpower(a，，n//2) 的 结果 来 计算 


rpower(a，n)， 如 图 10-9 所 示 。 


rpower(2, n) = 让 


power (2, n//2) power (2, n//2) 





图 10-9 递归 计算 fo ey n 为 偶数 时 "= a x a 


当 n 的 值 为 奇数 ， 我 们 同样 可 以 使 用 递归 调用 rpower(a，n//2) 的 结果 来 计算 
rpower(a，n), 但 是 需要 增加 一 个 因子 a， 如 图 10-10 所 示 。 


rpower(2, 到 = |2X2X xD) KX |2K2K,2| XK 12| 


power (2, n//2) power (2, n//2) 





图 10-10 ”递归 计算 we。 当 为 奇数 时 ，w ax xxa 


基于 上 述 观 察 分 析 结 果 ，rpower ( ) 的 递归 实现 代码 如 下 所 示 。 注 意 ， 只 有 一 次 递归 调 
用 rpower(a, n//2)。， 


模块 : ch10.py 
!' def rpower(a, n): 
!' 返回 a 的 n 次 办 ， 
; if ni == 0: # 基本 情况 : n == 0 
return 1 


tmp = rpower(a, n//2) # 递归 步骤 : n > 0 


if n % 2 == 0: 
8 return tmp*tmp # a**n = a**(n//2) * a**a(n//2) 
10 else: # n % 2 == 1 
return a*tmp*tmp # a**n = a**(n//2) * a**a(n//2) * a 


现在 我 们 有 两 个 不 同 版 本 的 过 曙 数 的 实现 : power() 和 rpower()。 如 何 判 断 哪 一 个 
更 有 效率 呢 ? 
10.3.2 ”运算 次 数 

比较 两 个 孔 数 的 效率 的 一 种 方法 是 计算 每 个 函数 在 同一 输入 下 执行 的 运算 次 数 。 在 
power( ) 和 rpower() 的 情况 下 ， 我 们 缩减 为 仅 计算 乘法 的 次 数 。 


很 显然 ，power(2， 10000) 需要 10000 次 乘法 。 那 么 rpower(2， 10000) 需要 多 
少 次 ?要 回答 这 个 问题 ,我们 修改 rpower ( ) ， 使 得 它 统 计 执 行 乘法 的 次 数 。 为 此 ， 我 们 
通过 每 一 次 乘法 时 递增 一 个 全 局 变量 counter (在 困 数 外 部 定义 ) 的 方法 来 实现 : 


模块 : ch10.py 


1 def rpower(a, n): 
返回 aa 的 了 次 里 ， 
3 global counter # 统计 乘法 的 次 数 
if n==0: 
return 1 
7 ba 
8 tmp = rpower(a, n//2) 


if Hh2 <== 0 
1 counter += 1 
return tmp*tmp # 一 次 乘法 


else: # n % 2 == 1 
; counter += 2 
'6 return a*tmp*tmp # 两 次 乘法 


接 下 来 我 们 进行 统计 : 

>>> Counter = 0 

>>> rpower(2, 10000) 
199506311688.. .792596709376 
>>> counter 

19 


因此 ， 递 归 方 法 实现 的 乘 蝴 运算 困 数 ， 可 以 把 乘法 的 次 数 从 10000 减少 到 23。 


10.3.3 ” 斐 波 那 契 数列 

我 们 在 第 5 章 介 绍 了 斐 波 那 契 数列 : 

本 县 0 

我 们 还 描述 了 一 种 构建 斐 波 那 契 数列 的 方法 : 数列 中 的 一 个 数 是 数列 中 前 两 个 数 之 
和 (除了 最 前 面 的 两 个 1 )。 这 个 规则 在 本 质 上 是 递归 的 。 所 以 ， 如 果 我 们 要 实现 一 个 男 数 
rfib()， 带 一 个 非 负 整 数 半 作为 输入 参数 ， 返 回 第 半 个 斐 波 那 契 数 ， 看 起 来 很 目 然 可 以 使 
用 一 个 递归 来 实现 。 接 下 来 我 们 讨论 其 递归 实现 。 

既然 递归 规则 适用 于 第 0 个 和 第 1 个 之 后 的 韭 波 那 契 数 ,递归 基本 情况 为 n 三 1( 即 
n=0 或 n=1 ) 是 有 道理 的 。 在 基本 情况 下 ，rfib() 应 该 返回 1: 


def rfib(n): 
' 返回 第 mn 个 斐 波 那 契 数 
二 才 32 # 基本 情况 
return 1 


# 函数 的 剩余 代码 
递归 步骤 适用 于 输入 n > 1。 在 这 种 情况 下 ， 第 个 斐 波 那 契 数 为 第 呈 1 个 和 第 n-2 个 
斐 波 那 契 数 之 和 ， 


模块 : ch10.py 
def rfib(n): 
' 扳 回 第 nm 个 斐 波 那 契 数 ， 
二 间 遂 受 。 # 基本 情况 


return 1 


return rfib(n-1) + rfib(n-2) # 谤 归 步 又 


让 我 们 验证 函数 rfib( ) 的 运行 结果 : 
>>> rfib(t0) 

1 

53 TF 

1 

>>> rfib(4) 

5 

>3% rEIDCS) 

34 


结果 看 起 来 正确 。 让 我 们 答 试 计算 一 个 较 大 的 斐 波 那 契 数 : 

>>> rfib(35) 

14930352 

结果 正确 。 但 计算 花费 了 一 定时 间 (请 读者 尝试 )。 如 果 我 们 尝试 : 


>>> rfib(100) 


结果 要 等 待 很 长 的 时 间 。( 记 住 ， 你 可 以 通过 同时 按 【 CtrltC ] 键 终止 程序 的 执行 。) 
计算 第 36 个 斐 波 那 契 数 真 的 那么 耗 时 吗 ? 回想 一 下 ， 我 们 已 经 在 第 5 章 中 实现 了 一 个 
返回 第 ”个 辈 波 那 契 数 的 函数 : 


模块 : ch10.py 


def fib(n): 
' 返回 第 m 个 斐 波 那 契 数 ， 
Previous = 1 # 第 0 个 斐 波 那 契 数 
current = 1 # 第 1 个 斐 波 那 契 数 
i=1 # 当前 斐 波 那 契 数 的 索引 


while i < n: # 当当 前 斐 波 那 契 数 不 是 第 n 个 斐 波 那 契 数 
previous, current = current, previous+current 
i += 1 


return current 


让 我 们 验证 运行 结果 : 
>>> fib(35) 
14930352 


3355 £1ib(100) 
573147844013817084101 
>>> fib(10000) 
b4438373113565 ,,。 


所 有 的 结 来 瞬时 完成 。 让 我 们 来 探讨 rfib( ) 出 错 的 原因 。 
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10.3.4 运行 时 间 的 实验 分 析 


一 种 比较 限 数 fib() 和 rfib() (或 其 他 孔 数 ) 的 精确 方法 是 基于 相同 的 输入 运行 这 些 
中 数 并 比较 它们 的 运行 时 间 。 作 为 好 的 (懒惰 的 ) 程序 员 ， 我 们 喜欢 自动 化 这 个 过 程 ， 所 以 
我 们 开发 了 一 个 可 以 用 来 分 析 图 数 运 行 时 间 的 应 用 程序 。 我 们 将 该 应 用 程序 普遍 化 ， 以 适用 
于 除了 fib() 和 rfib() 的 其 他 函数 。 

我 们 的 应 用 程序 由 几 个 盟 数 组 成 。 一 个 关键 的 困 数 是 timing( )， 用 以 测量 郴 数 基于 输 
人 的 运行 时 间 。 它 是 一 个 高 阶 函 数 ， 带 两 个 输入 参数 : (1 ) 一 个 困 数 func, (2 ) 一个“ 输 
和信 规模 ” (整数 )， 在 一 个 给 定 规 模 的 输入 上 运行 限 数 func， 返 回 其 运行 时 间 。 


模块 : ch10.py 


import time 
def timing(func, n): 
' 将 函数 buildInput 返回 的 input 作为 输入 参数 运行 函数 func ， 
4 funcInput = buildInput(n) # 为 函数 func 获取 输入 参数 input 


5 start = time ,time() # 获取 开始 时 间 
6 func(funcInput) # 以 funcInput 为 输入 参数 运行 函数 func 
: end = time.time() # 获取 结束 时 间 

return end - start # 返回 执行 时 间 


男 数 timing() 使 用 time 模块 中 的 time() 困 数 获取 执行 图 数 func 前 后 的 系统 时 
间 ， 二 者 之 差 就 是 困 数 运行 时 间 。( 注 意 : 测量 的 时 间 可 能 受到 计算 机 可 能 正在 运行 的 其 他 
任务 的 影响 ， 但 我 们 避免 处 理 这 个 问题 。) 

国 数 buildinput() 市 一 个 输入 规模 作为 输入 参数 ， 返 回 一 个 适合 于 冰 数 func ( ) 输 
入 的 对 象 ， 并 且 具 有 合适 的 输入 规模 。 这 个 明 数 是 依赖 于 我 们 正在 分 析 的 果 数 func( ) 。 在 
斐 流 那 息 滑 数 fib() 和 zfib() 的 情况 下 ， 对 应 于 输入 规模 n 的 输入 恰恰 就 是 n: 


模块 : ch10.py 
def buildInput (ny) : 
' 返回 裴 波 那 契 函数 的 输入 参数 ， 
return n 


比较 两 个 孔 数 在 同一 个 输入 上 的 运行 时 间 并 不 能 说 明 哪 个 水 数 更 好 ( 即 更 快 )。 比 较 两 
个 函数 在 大 干 不 同 输入 上 的 运行 时 间 更 有 用 。 这 样 ， 我们 可 以 尝试 理解 当 输 入 规模 ( 即 问题 
规模 ) 增 大 时 两 个 图 数 的 行为 。 为 此 ， 我 们 开发 了 困 数 timingaAnalysis， 它 在 一 系列 递 
增 规模 的 输入 上 运行 任意 陶 数 并 报告 运行 时 间 。 


模块 : ch10.py 


def timingAnalysis(func, start, stop, inc, runs): 
''， 打印 函数 func 的 平均 运行 时 间 ， 输 入 规模 
3 分 别 为 start, start + inc, start +2* inc，…， 直 到 stop ' 
4 for n in range(start，stop，inc): # 对 于 每 个 输入 规模 n 
: acc = 0.0 # 累积 器 初始 化 


for i in range(runs) : # 重复 运行 次 数 
8 acc += timing(func, n) # 根据 输入 规模 n 运行 函数 func 
9 # 并 且 累 积 运行 次 数 
0 # 打印 运行 规模 为 n 的 平均 运行 时 间 


formatStr = 'Run time of {}({}) is 
Print(formatStr .format(func.__name 


{7f} Seconds." 
dee/ Pne) > 


呐 数 timingAnalysis 市 五 个 输入 参数 : 图 数 func 和 数值 start、stop、inc、 
runs。 它 首先 在 输入 规模 start 上 运行 func 若干 次 ， 然 后 输出 平均 运行 时 间 。 然 后 在 输 
入 规模 start+inc、start+2*inc、…， 直 到 输入 规模 stop 上 重复 执行 。 

在 函数 fib() 和 输入 规模 分 别 为 24、26、28、30、32、34 上 运行 子 数 timin- 
RAnalysis()， 结 果 如 下 : 


>>> timingAnalysis(fib，24，35，2，10) 

Run time of fib(24) is 0.0000173 seconds . 
Run time of fib(26) is 0.0000119 seconds. 
Run time of fib(28) is 0.0000127 seconds. 
Run time of fib(30) is 0.0000136 seconds. 
Run time of fib(32) is 0.0000144 seconds. 
Run time of fib(34) is 0.0000151 seconds. 
在 图 数 fib() 上 执行 同样 的 操作 ， 结 果 如 下 : 








>>> timinghinalysis(rfib, 24, 35, 2, 10) 
Run time of fibonacci(24) Ls 0:0797332 seconds.. 
Run time of fibonacci(26) is 0.2037848 seconds. 
Run time of fibonacci(28) is 0.5337492 seconds. 
Run time of fibonacci(30) is 1.4083670 seconds. 
Run time of fibonacci(32) is 3.6589111 seconds. 
Run time of fibonacci(34) is 9.5540136 seconds. 
两 次 实验 的 结果 如 图 10-11 所 示 。 
time (sec) 
rfib(n) 
rs fib(n) 
二 摹 一 一 — 后 一 -一 -各 - 一 一 于 一 一 -一 -一 一 一 一 一 末 一 一 > 也 
26 28 30 32 34 
图 10-11 运行 时 间 图 。 其 中 显示 了 对 于 输入 n=24, 26, 28, 32 和 34，fib() 和 rfib( ) 的 平均 


运行 时 间 (单位 : 秒 ) 


fib() 的 运行 时 间 可 以 忽略 不 计 。 然 而 ，rfib( ) 的 运行 时 间 则 随 着 输入 规模 增加 而 
快速 增加 。 事 实 上 ， 运 行 时 间 在 连续 两 个 输入 规模 间 增 大 了 1 倍 多 。 这 意味 着 相对 于 输入 规 
模 ， 运 行 时间 成 指数 规模 增加 。 为 了 理解 递归 也 数 rfibp( ) 糟糕 性 能 的 背后 原因 ， 我 们 在 
图 10-12 中 描述 了 其 执行 流程 。 

图 10-12 显示 了 计算 rfib(n) 时 执行 的 一 些 递归 调用 。 要 计算 fib(n)， 必 须 递归 
调用 zfib(n-1) 和 rfib(n-2) ; 要 计算 rfib(n-1) 和 rfib(n-2)， 必 须 分 别 单独 弟 
归 调 用 rfib(n-2) 和 rfib(n-3), 以 及 rfib(n-3) 和 rfib(n-4)， 以 此 类 推 。 

rfib(n) 的 计算 包含 两 个 独立 的 rfib(n-2) 的 计算 ， 因此 花费 的 时 间 是 rfib(n-2) 
的 两 倍 。 这 解释 了 指数 规模 运行 时 间 的 原因 。 它 同时 指出 了 递归 解决 方案 zfib() 的 问题 
所 在 : 它 一 次 又 一 次 地 重复 执行 一 个 果 数 调用 。 例 如 ， 郴 数 调 用 zfib(n-4) 被 执行 了 五 


次 ,虽然 其 结果 一 样 。 


rfib(n) 
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图 10-12 递归 调用 树 。 计 算 rfib(n) 需要 两 次 递归 调用 zfib(n-1) 和 rfib(b-2)。 计 
算 rfib(n-1) 需 要 递归 调用 rfib(n-2) 和 rfipb(n=3); 计算 rfib(n-2) 
需要 递归 调用 zfib(n-3) 和 rfib(n-4)。 同 一 个 递归 调用 被 执行 多 次 ， 例 如 
rfib(n-4) 被 重复 计算 了 五 次 


5 使 用 本 节 开 发 的 运行 时 间 分 析 应 用 程序 ， 分 析 函 数 power( ) 、zPowezr( )， 
以 及 内 置 运 算 符 ** 的 运行 时 间 。 为 此 ， 可 以 通过 在 如 下 所 示 的 函数 power2()、rpower2() 
和 pow2() 上 , 使 用 输入 规模 20 000 到 80 000( 步 长 为 20 000 ), 运行 timingAnalysis()。 


def power2(n): 

return power(2,n) 
def rpower2(n): 

return rpower(2,n) 
def pow2(n): 

return 2**n 


完成 后 ， 讨 论 实 现 内 置 的 殴 操 作 符 ** 可 能 使 用 的 方法 。 


10.4 ”查找 

在 上 一 节 中 ,我 们 了 解 到 ,设计 和 实现 一 个 程序 的 方法 可 以 对 程序 在 大 数据 集 上 的 运行 
时 间 有 显著 的 影响 ， 最 终 会 影响 其 实用 性 。 在 本 节 中 ,我 们 将 考虑 如 何 重 组 输入 数据 集 并 添 
加 结构 以 显著 地 提高 程序 的 运行 效率 和 实用 性 。 我 们 将 着 重 研究 若干 基本 搜索 任务 ， 通 常 使 
用 排序 算法 介绍 数据 集 的 结构 。 我 们 从 检查 一 个 值 是 否 包含 在 列表 中 的 基本 问题 开始 . 


10.4.1 线性 查找 


运算 符 in 和 列表 类 的 index( ) 方法 在 一 个 列表 中 查找 一 个 给 定 的 项 。 因 为 我 们 已 
(并 且 将 ) 大 量 使 用 这 些 方法 ， 理 解 它 们 的 执行 速度 是 很 重要 的 。 


请 回顾 一 下 运算 符 in 用 于 检查 某 个 项 是 否 在 列表 中 存在 : 


>>> lst = random.sample(range(1,100), 17) 
>>> 18t 


[2 9 3 2 

>32> 全 5 in lL8t 

True 

>>>. 75 Ln lest 

False 

index( ) 方法 功能 类 似 : 结果 不 是 返回 True 或 者 False， 而 是 返回 项 第 一 次 出 现 的 
位 置 夫 3 引 (或 者 ， 如 果 列 表 中 不 存在 该 项 时 将 引发 一 个 异 笛 )。 

如 果 列 表 中 的 数据 没有 采用 任何 结构 ， 则 实际 上 只 有 一 种 方法 来 实现 in 或 index() : 
对 列表 中 的 项 进行 系统 查找 ， 无 论 是 从 索引 0 向 上 查找 ， 或 者 是 从 索引 -1 向 下 查找 ， 还 是 
其 他 等 价 查 找 方法 。 这 种 类 型 的 查找 方法 被 称 为 线性 查找 。 假 设 从 索引 0 开始 向 上 查找 ， 线 
性 查找 将 查看 列表 中 的 15 个 元 素 后 查找 到 45， 查 找 所 有 的 元 素 后 才 发 现 75 不 在 列表 中 。 

线性 查找 可 能 需要 查看 列表 中 的 每 一 项 。 在 最 坏 的 情况 下 ， 它 的 运行 时 间 与 列表 的 大 小 
成 比例 。 如 果 数 据 集 没有 结构 化 ， 并 且 数 据 项 不 能 比较 ,那么 线性 查找 是 在 列表 中 查找 的 唯 
一 万 法 


10.4.2 ”二 分 查找 


如 果 列 表 中 的 数据 是 可 比较 的 ， 我 们 可 以 首先 对 列表 进行 排序 ， 从 而 提高 查找 运行 时 
间 。 为 了 说 明 这 一 点 ， 我 们 使 用 线性 查找 中 使 用 的 同一 列表 1st， 但 已 经 排 好 了 序 : 

> Tat Bort( 

>>> lst 

[Es 0 4 ~ 90 3991 

假设 我 们 在 列表 lst 中 查找 值 target。 线 性 查找 把 target 与 1st 中 的 索引 0 的 项 
比较 ， 然 后 与 索引 1、2、3 的 项 比较 ， 以 此 类 推 。 假 设 我 们 首先 将 target 与 案 引 i 的 项 比 
较 (1Lst 的 任意 索引 门 。 有 三 种 可 能 的 结果 : 

e@ lst[i] == target 为 true， 很 幸运 ， 查 找到 目标 

® target < 1st[i] 为 true 

® target > lst[i] 为 true 

让 我 们 做 一 个 实验 。 假 设 target 的 值 为 45， 我们 将 它 与 案 引 5 中 的 项 ( 即 24 ) 进行 
比较 。 显 然 ， 在 这 种 情况 下 出 现 第 3 个 结果 “target > 1st[i]”。 因 为 列表 1st 是 排 
好 序 的 ， 这 告诉 我 们 target 不 可 能 位 于 24 的 左 侧 ( 即 子 列表 1lst[0:5])。 因 此 ， 我 们 
应 该 继续 在 24 的 右 侧 ( 即 子 列表 lst[6:17]) 中 查找 target， 如 图 10-13 所 示 。 


| 2 3 4 3 6 7 S 9 A ws 
2 5 11 13 16 28 41 42 43 45 57 72 73 89 90 99 
28 41 42 43 45 57 72 73 89 90 99 
图 10-13 ”二 分 查找 。 通 过 把 target 的 值 45 与 1st 的 索引 5 的 项 进行 比较 ， 我们 把 搜索 空 
间 缩 减 到 子 列 表 lst[6:] 


我 们 得 出 主要 见解 如 下 : 只 需 把 target 和 1ist[5] 进行 一 次 比较 ， 我 们 就 把 搜索 空 
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则 从 17 个 列表 项 缩减 到 11 个 。( 在 线性 查找 中 ， 一 次 比较 缩减 搜索 空间 一 个 列表 项 。) 现在 
我 们 应 该 问 问 上 自己 不 同 的 比较 是 否 会 进一步 缩减 搜索 空间 。 

在 某 种 意义 上 ,target > lst[5] 的 结果 并 不 理想 : 因为 target 位 于 1Lst[0:5]( 包 
含 5 个 项 ) 和 1lst[6:17] (包含 11 个 项 ) 中 的 较 大 的 一 侧 。 为 了 减少 运气 的 作用 ， 我 们 可 
以 确保 子 列表 大 小 基本 相同 。 我 们 可 以 通过 把 target 和 42 ( 即 列 表 中 间 的 项 目 (也 称 为 中 
位 数 )) 比较 来 实现 这 一 目标 。 

我 们 刚刚 得 到 的 见解 是 一 种 叫 作 二 分 查找 的 搜索 技术 的 基础 。 给 定 一 个 列表 和 一 个 目 
标 ， 二 分 查找 返回 列表 中 目标 的 索引 ， 如 有 果 目 标 不 在 列表 中 ， 则 返回 -1。 

二 分 查找 很 容易 采用 递归 实现 。 基 本 情况 是 当 列 表 1st 为 空 时 ，target 不 可 能 在 其 
中 ， 因 此 返回 -1。 和 否则 ， 我 们 将 目标 与 列表 中 位 数 进行 比较 。 根 据 比 较 的 结果 ， 我 们 要 么 
完成 查找 ， 要 么 继续 在 lst 的 子 列表 上 递归 查找 。 

我 们 把 二 分 查找 实现 为 一 个 递归 明 数 search()。 因 为 递归 也 数 在 原始 列表 1st 的 子 
列表 lst[i:j] 上 调用 ， 因 此 上 盟 数 search( ) 审 四 个 输入 人 参数， 除了 L1st 和 target， 还 
包含 索引 工 和 本: 


模块 : ch10.py 


1 def search(lst, target, i, j): 


' 试图 在 已 排序 子 列表 lst [i:j ] 中 查找 目标 target 
如 果 找 到 目标 ， 则 返回 目标 所 在 的 索引 ， 否 则 返回 -1 '' 


4 i m= |: # 基本 情况 : 空 列表 

5 return -1 # 目标 不 可 能 位 于 列表 中 

， mid = (i+j)//2 # 列表 1[j] 中 位 数 的 索引 
if 1st[mid]j == target: # 目标 是 中 位 数 

10 | return mid 
if target < lst[mid]: # 搜索 中 位 数 的 左 半 部 分 

return search(lst, target, i, mid) 

else: # 搜索 中 位 数 的 右 半 部 分 

14 return search(lst, target, mid+1, j) 


一 开始 在 1st 中 查找 target 时 ， 应 该 使 用 索引 0 和 len(1st): 


>>> target = 45 
>3> search(lst, target, 0, len(tlst)) 
10 | 


图 10-14 描述 了 二 分 查找 的 执行 流程 。 
:EE 


2 1 13 28 I 姑 5 7 73 8 0 09| 





43 45 57 [72| 73 89 90 99 

43 | 57 

图 10-14 ”二 分 查找 。 查 找 45 从 列表 1st[0:171] 开始 。 把 45 与 中 位 数 (42 ) 比较 后 ， 继 续 
在 子 列表 1st[9:17] 中 查找 。 把 45 与 子 列 表 的 中 位 数 (72 ) 比较 后 ， 继 续 在 子 列 
表 1st[9:12] 中 查找 。 由 于 45 是 1st[9:12] 的 中 位 数 ， 查 找 结束 


10.4.3 ”线性 查找 和 二 分 查找 比较 


为 了 证 明 二 分 查找 平均 比 线性 查找 要 快 得 多 ， 我 们 进行 试验 。 使 用 上 一 节 开 发 的 
timingAnalysis() 应 用 程序 ， 我们 比较 函数 search( ) 和 内 置 列表 方法 index( )。 为 
此 ,我 们 开发 了 卫 数 binary() 和 1Lineazr()， 随 机 选择 一 个 输入 列表 中 的 项 ， 分 别 调用 
search( ) 或 者 调用 方法 index( ) ， 查 找 该 项 : 


模块 : ch10.py 


def binary(lst): 
:随机 在 列表 1st 中 选择 一 项 ,在 该 项 上 运行 函数 search() ' 
target=random.choice(lst) 
4 return search(lst, target, 0, len(lst)) 


def linear(lst): 
， 随机 在 列表 1st 中 选择 一 项 ， 在 该 项 上 运行 函数 index () ， 
target=random.choice(lst) 
return lst.index(target) 


我 们 将 使 用 大 小 为 n 的 列表 1st， 作 为 范围 从 0 到 22- 1 的 n 个 数值 的 随机 采样 。 


模块 : ch10.py 


def buildInput(n) : 
' 返回 范围 在 [0，2n) 的 n 个 数值 的 随机 样本 ， 
lst = random.sample(range(2*n), n) 
18t, sort() 
return lst 


结果 如 下 : 


>>> timingAnalysis(1Linear，200000，1000000，200000，20) 
Run time of linear(200000) is 0.0046095 

Run time of linear(400000) is 0.0091411 

Run time of linear(600000) is 0.0145864 

Run time of linear(800000) is 0.0184283 

>>> timingAnalysis(binary，200000，1000000，200000，20) 
Run time of binary(200000) is 0.0000681 
Run time of binary(400000) is 0.0000762 

Run time of binary(600000) js 0.0000943 

Run time of binary(800000) is 0.0000933 


很 显然 ， 二 分 查找 更 快 ， 线 性 查找 运行 时 间 与 列表 的 大 小 成 正比 。 关 于 二 分 查找 运行 时 
间 的 有 趣 之 处 是 它 似 乎 并 没有 增加 多 少 。 那 是 为 什么 ? 
虽然 线性 搜索 最 终 可 能 会 检查 列表 中 的 每 一 项 ,但 二 分 查找 将 检查 更 少 的 列表 项 。 要 证 
明 这 一 点 ， 请 回顾 我 们 前 面 得 出 的 见解 ， 即 在 每 一 次 二 分 查找 比较 中 ， 搜 索 空 间 缩 减 了 一 半 
以 上 。 当 然 ， 当 搜索 空间 变 为 1 或 更 小 时 ,搜索 就 结束 了 。 在 一 个 大 小 为 n 的 列表 上 实施 二 
分 查找 的 搜索 次 数 的 上 限 为 : 把 n 二 分 直到 最 终 为 1 时 所 需要 的 次 数 。 如 果 表 示 为 公式 ， 它 
是 如 下 公式 中 x 的 值 : 
n 
FE 
上 述 公 式 的 解 为 x = logyn， 以 2 为 底 的 的 对 数 。 这 个 函数 确实 随 着 n 的 增加 而 非常 组 


= 


慢 地 增长 口 
本 节 的 剩余 部 分 我 们 将 讨论 硅 干 其 他 基本 的 类 似 查找 问题 ， 并 分 析 解 决 这 些 问 题 的 不 同 
方法 。 


10.4.4 唯一 性 测试 


我 们 考虑 这 个 问题 : 给 定 一 个 列表 ， 其 中 的 每 一 项 都 是 唯一 的 吗 ?” 解决 这 个 问题 的 一 种 
目 然 方法 是 壳 有 历 列表 ， 并 对 每 个 列表 项 检查 该 项 是 否 在 列表 中 出 现 不 止 一 次 。 函 数 dup1() 
实现 了 这 个 想法 : 


模块 : ch10.py 


! def dupl(lst): 
' 如 果 列 表 lst 中 有 重复 项 ， 则 返回 True， 否 则 返回 False ' 
tor item 4n 18t.: 
if lst,count(item)} > 43 
return True 
return False 


和 运算 符 in 以 及 index() 方法 一 样 ， 要 统计 一 个 目标 项 出 现 的 次 数 ， 列 表 方 法 
count ( ) 必须 对 列表 执行 线性 查找 。 所 以 , 在 auplicatesl() 中 ， 针 对 每 个 列表 项 都 执 
行 一 次 线性 查找 。 是 否 存在 更 好 的 方法 呢 ? 

如 果 我 们 先 对 列表 进行 排序 呢 ? 这 样 做 的 优点 是 ， 重 复 的 项 将 在 排序 列表 中 彼此 相 邻 。 
因此 ， 要 判断 是 否 有 重复 项 ， 我 们 需要 做 的 是 把 每 一 个 项 与 其 前 一 个 项 进行 比较 : 


模块 : ch10.py 


1 def dup2(1st) : 
， 如 果 列 表 lst 中 有 重复 项 ， 则 返回 True， 和 否则 返回 False ， 


1 七 ,OBEt() 
for index in range(1, len(lst)): 
if 1stLindex] == lst [index-1]: 


return True 
return False 


这 种 方法 的 优点 是 它 只 需要 遍历 一 次 列表 。 当 然 ， 这 种 方法 是 有 代价 的 : 我 们 必须 痛 先 
对 列表 进行 排序 。 

在 第 6 革 中 ， 我们 看 到 字典 和 集合 可 以 用 来 检查 一 个 列表 是 否 包 含 重 复 的 内 容 。 限 数 
dup3() 和 dup4() 分 别 使 用 字典 或 集合 来 检查 输入 列表 是 否 包含 重复 项 : 


模块 : ch10.py 


' def dup3(1st) : 
'， 如 果 列 表 1st 中 有 重复 项 ， 则 返回 True， 和 否则 返回 False ' 
s = set() 
for Ttem in J8t: 
Lf LPem TN s: 
return False 
else: 
s.add(item) 
return True 


， def dup4(1st) : 


' 如 果 列 表 lst 中 有 重复 项 ， 则 返回 True， 和 否则 返回 False ' 
return len(lst) != len(set(lst)) 


我 们 把 这 四 个 盟 数 的 分 析 作 为 练习 题 。 


EAs 司 通过 实验 ,分析 函 数 dupl1()、dup2()、dup3() 和 dup4() 的 运行 
时 间 。 要 求 在 10 个 大 小 为 2000、4000、6000 和 8000 的 列表 上 测试 各 函数 ， 获 取 列 表 的 方 
法 如 下 : 
Import random 
def buildInput (n): 
' 返回 一 个 范围 在 [0，n **2) 上 的 n 个 随机 整数 列表 ， 
res = [] 
for i in range(n): 
res.append(random.choice(range (n**2))) 
return res 


注意 该 函数 通过 重复 从 0 到 n"-1 中 选取 nn 个 数 的 方法 返回 列表 ,列表 可 能 包含 重复 项 。 
执行 完成 后 ， 请 分 析 并 解释 执行 结果 。 


10.4.5 选择 第 上 个 最 大 (或 最 小 ) 项 


在 一 个 无 序 的 列表 中 查找 最 大 (或 者 最 小 ) 项 的 最 佳 方法 是 线性 查找 。 碍 找 第 2 个 、 第 
3 个 或 第 个 最 大 (或 者 最 小 ) 项 也 可 以 使 用 线性 查找 完成 ， 虽 然 没 那么 简单 。 如 有 果 K 较 大 ， 
查找 第 个 最 大 (或 者 最 小 ) 项 可 以 通过 先 排序 列表 简单 实现 (存在 更 有 效 的 方法 ,但 它们 
超出 本 教程 的 范围 )。 返 回 列表 中 的 第 个 最 小 值 的 也 数 如 下 所 示 : 


模块 : ch10.py 


' def kthsmallest(lst, k): 
' 返回 列表 1st 中 的 第 k 个 最 小 项 ， 
lst.sort() 
return lst[k-1] 


10.4.6 ”计算 出 现 频率 最 多 的 项 


接 下 来 要 考虑 的 问题 是 查找 列表 中 出 现 频 率 最 高 的 项 。 我 们 实际 上 知道 如 何 实现 : 在 第 
6 革 中 ， 我 们 看 到 了 如 何 使 用 字典 来 计算 一 个 序列 中 所 有 项 的 频率 。 然 而 ， 如 有 果 仅 仅 想 找到 
频率 最 高 的 项 ,使 用 字典 有 点 大 材 小 用 并 且 浪 费 存储 空间 。 

我 们 已 经 看 到 ， 通 过 排序 一 个 列表 ， 所 有 重复 的 项 将 是 彼此 相 邻 的 。 如 果 我 们 遍历 已 排 
序 的 列表 ， 我 们 可 以 统计 每 个 重复 序列 的 长 度 ， 并 跟踪 最 长 的 序列 。 下 面 是 实现 这 个 想法 的 
代码 : 


模块 : ch10.py 


' def frequent(1st) : 
， 返回 一 个 非 空 列表 1st 中 
出 现 频率 最 多 的 项 '，'， 
lst.sort() # 首先 排序 列表 


了 00 务 10 恒 


6 currentLen = 1 # 当前 序列 的 长 度 
longestLen = 1 # 最 长 序列 的 长 度 
mostFreq = lst[0] # 具有 最 长 序列 的 项 


10 for i in range(1, len(lst)): 


# 将 当前 项 与 前 一 项 比较 


12 if lst[i] == lst[i-1]: # 如 果 相 等 
# 当前 序列 继续 
14 currentLen+=1 

else: # 如 果 不 相等 


# 如 果 必 要 的 话 ， 更 新 最 长 序列 
18 if currentLen > longestLen: # 如 果 当 前 序列 比 
# 最 长 序列 还 长 
longestLen = currentLen # 存储 当前 序列 的 长 度 
mostFreq = lst[i-1] # 以 及 该 序列 的 项 
# 开始 新 的 序列 


currentLen = 1 


return mostFreq 


I 实现 函数 frequent2()， 使 用 字典 来 计算 输入 列表 中 每 个 项 的 出 现 频 
率 ， 并 返回 出 现 频 率 最 高 的 项 。 然 后 进行 实验 ， 请 使 用 练习 题 10.9 中 定义 的 buildInput() 
函数 返回 的 列表 ， 比 较 frequent() 和 frequent2() 的 运行 时 间 。 


10.5 ”电子 教程 案例 研究 : 汉 话 塔 


在 案例 研究 CS.10 中 ， 我 们 讨论 汉 详 塔 问题 ， 一 个 用 递归 很 容易 解决 的 经 典 例题 。 我 们 
还 利用 这 个 机 会 通过 开发 新 的 类 和 使 用 面向 对 象 的 程序 设计 技术 来 开发 一 个 可 视 化 应 用 程序 。 


10.6 ”本章 小 结 


本 草 的 重点 是 递归 以 及 开发 递归 函数 来 解决 问题 的 过 程 。 本 章 还 介绍 了 程序 运行 时 间 的 
形式 化 分 析 ， 并 将 其 应 用 于 各 种 查找 问题 。 

递归 是 一 种 基本 的 解决 问题 技术 ， 可 以 应 用 于 构建 问题 的 “更 简单 ”版 本 的 解决 方案 。 
对 于 同一 个 问题 ， 递 归 解 决 方案 和 非 递归 解决 方案 相 比 ， 递 归 示 数 的 描述 〈( 即 实现 ) 常常 更 
简单 ， 因 为 递归 利用 操作 系统 的 资源 ， 特 别 是 程序 栈 。 

在 本 章 中 ， 我 们 利用 递归 函数 解决 各 种 各 样 的 问题 ， 例 如 分 形 图 形 的 可 视 化 显示 、 在 文 
件 系统 的 文件 中 查找 病毒 等 等 。 然 而 ， 这 些 实例 的 主要 目标 是 明确 前 述 如 何 进行 递归 思维 ， 
掌握 一 种 使 用 递归 解决 问题 的 方法 。 

在 某 些 情况 下 ， 递 归 思 维 提供 了 洞察 力 ， 从 而 产生 比 明 显 的 或 原始 的 解决 方案 更 有 效 的 
解决 方案 。 但 在 其 他 情况 下 ， 递 归 将 导致 一 个 更 糟糕 的 解决 方案 。 我 们 介绍 了 程序 运行 时 间 
分 析 ， 以 此 来 量化 和 比较 各 种 程序 的 执行 时 间 。 当 人 然 ， 运行 时 间 分 析 不 限于 递归 水 数 ， 我 们 
也 使 用 它 来 分 析 各 种 查询 问题 。 


10.7 练习 题 答 案 


10.1 通过 修改 图 数 vertical( ) 得 到 也 数 reverse() (当然 ， 得 重 命名)。 注 意 ， 清 数 vertical() 





10.2 


10.3 


10.4 


10.5 


在 输出 除 最 后 一 个 数字 的 所 有 数字 后 ， 输 出 最 后 一 个 数字 。 困 数 reverse() 则 正好 相反 : 


def reverse(n) : 


， 按照 从 低位 到 高 位 的 顺序 ， 垂 直 输 出 n 的 每 一 位 数字 ， 


if 0; # 基本 情况 : 只 有 一 个 数字 的 数值 
print (n) 

else: # n 至 少 有 两 位 数字 
print (n%10) # 打印 n 的 最 后 一 位 数字 


reverse(n//10) # 说 归 ( 反 序 ) 打印 除了 最 后 
# 一 位 数字 的 其 他 所 有 数字 


在 基本 情况 下 ， 当 n= 0, 仅 输 出 'Hurray!!!'。 当 n>0，,， 我 们 知道 至 少 应 该 输出 一 
个 "Hip'， 程 序 中 输出 该 字符 串 。 这 意味 着 还 剩 下 -1 个 'Hip' 和 'Hurray!!!' 需要 输出 。 
而 这 正 是 递归 调用 cheers (n-1) 的 结果 。 


def cheers (D) : 
'prints cheer 
if n == 
print('Hurray!!!') 
elSe: # n>0 
print('Hip’”, end=" *) 
cheers(n-1) 
基于 阶乘 也 数 n! 的 定义 ,递归 的 基本 情况 是 n= 0 和 n= 1。 在 这 两 种 情况 下 ， 晴 数 factorial() 
应 该 返回 1。 对 于 n> 1,，n! 的 递归 定义 表示 factorial() 应 该 返回 n * factorial(n-1): 
def factorial (n): 
1 退回 机 4 * 
if n == 0: # 基本 情况 
return 1 
return factorial(n-1) * n # 弟 归 步 骤 : 当 n > 0 时 


在 基本 情况 下 ， 当 n= 0， 什么 也 不 输出 。 如 果 n > 0， 注 意 pattern2(n) 的 输出 包含 
pattern2(n-1) 的 输出 ， 然 后 输出 一 行 n 个 星 号 ， 再 接着 是 pattern2(n-1) 的 输出 : 


def pattern2(n) : 
， 打印 第 n 个 模式， 
1 
pattern2(n-1) # 打印 pattern2(n -1) 
print(n * '*')  # 打 印 n 个 星 号 
pattern2(n-1) # 打印 pattern2(n -1) 


如 图 10-15 中 的 snowflake (4) 所 示 ， 一 个 雪花 模式 包含 三 个 koch (3) 模式 ,分 别 沿 等 边 三 
角形 的 边 绘 制 。 


图 10-15 模式 snowflake(4)。 要 绘制 模式 snowflake(n)， 我 们 需要 先 绘 制 模式 


koch(n) ， 向 右 旋转 120 度 ， 再 绘制 koch(n) ， 再 向 右 旋转 120 度 ， 最 后 一 次 绘制 
koch(n) 
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def drawSnowflake(n): 
”使 用 koch() 函数 三 次 ,绘制 第 n 个 雪花 模式 ， 
s = Screen() 
t = Turtle() 
directions = koch(n) 


for i in range(3) : 
for move in directions: # 绘制 koch (n) 


If move == 'F': 
t.fd(300/3**n) 
if move == 'L': 
t.1t(60) 
if move == 'R': 
Gvt(120) 
trl120) # 向 右 转 120 度 


s.bye() 


如 果 列 表 是 空 ， 则 返回 值 应 该 为 Fasle ; 否则 ， 当 且 仅 当 1st[:-1] 包含 一 个 负数 或 1st[- 
1] 为 负数 时 ， 返 回 True: 
def recNeg(lst): 
' 如 果 列 表 1st 中 存在 负数 ， 则 返回 True; 
否则 返回 False ' 
if lJen(lst) == 0: 
return False 
return recNeg(lst[:-1]) or lst[-1] < 0 


内 置 明 数 sum( ) 应 该 应 用 到 table 的 每 一 个 项 ( 行 ): 
>>> Table = [由 253] ， 1 5 本] 


>>> recMap(table, sum) 

[6, 15] 
运行 测试 之 后 ， 可 以 注意 到 power2( ) 的 运行 时 间 最 糟糕 ， 而 pow2 ( ) 和 rpow( ) 的 运行 时 间 
则 十 分 接近 。 看 起 来 内 置 运 算 符 ** 使 用 了 一 种 等 价 于 我 们 递归 解决 方案 的 方法 。 
虽然 aup2() 包含 额外 的 排序 步骤 ， 你 会 注意 到 dup1( ) 更 加 慢 。 这 意味 着 daupl( ) 的 多 重 线性 
查找 方法 效率 非常 低下 。dup3() 和 dup4() 中 的 字典 和 集合 方法 效果 最 好 ， 且 集合 方法 最 终 胜 
出 。 最 后 两 种 方法 存在 的 一 个 问题 是 它们 都 使 用 一 个 额外 的 容器 ， 因 此 占用 了 更 多 的 内 存 空间 。 


10.10 可 以 使 用 第 6 章 的 困 数 frequency( ) 来 实现 fregqent2()。 


10.8 习题 


1Q:11 


10.12 


10.13 


10.14 


使 用 图 10-1 作为 模型 ， 绘 制 执行 countdown (3) 产生 的 所 有 步 又， 包括 每 次 递归 调用 开始 和 
结束 时 的 程序 栈 状态 。 

交换 前 数 countdown( ) 的 第 6 行 和 第 7 行 中 的 语句 ， 创 建 吨 数 countdown2 ( ) 。 请 解释 其 
与 countdown( ) 的 差别 。 

使 用 图 10-1 作为 模型 ， 绘 制 执行 countdown2(3) 产生 的 所 有 步骤 ， 其 中 countdown2() 
是 习题 10.2 中 的 图 数 。 

修改 函数 countdown ( ) ， 使 得 其 运行 结果 如 下 : 

>>> countdown3(5) 

5 

4 


3 
BOOOM!!! 
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Scared you... 
e 
1 
Blastoff!!! 
使 用 图 10-1 作为 模型 ,绘制 执行 pattern(2) 产生 的 所 有 步 又 ,包括 每 次 递归 调用 开始 和 结 
束 时 的 程序 栈 状 态 。 
计算 从 一 个 n 个 项 的 集合 中 选择 个 项 的 方法 个 数 的 递 推 公式 表示 为 c(n, 局 ， 公 式 如 下 : 

] 大 而 
C(n,k)=40 n=<k 
C(n-Lk-1)+C(n-1,k) 其 他 情形 

第 一 种 情况 表示 不 选择 任何 项 的 方法 有 一 种 ; 第 二 种 情况 表示 从 集合 中 选择 多 于 项 的 个 数 
的 项 的 方法 根本 不 存在 。 最 后 一 种 情况 分 别 统 计 包 含 最 后 一 个 集合 项 的 个 项 的 集合 的 个 数 ， 
以 及 不 包含 最 后 一 个 集合 项 的 上 个 项 的 集合 的 个 数 。 编 写 一 个 递归 师 数 combinations()， 
使 用 该 递 推 公式 计算 Cln, 局。 
>>> Combinations(2，1) 
0 
>>> combinations(1, 2) 
2 
>>> Combinations(2，5) 
10 
参照 针对 男 数 rpower ( ) 的 操作 ， 修 改 男 数 zfib()， 统 计 递 归 调 用 的 次 数 。 然 后 使 用 该 男 
数 统计 对 于 n=10、20 、30 情况 下 递归 调用 的 次 数 。 


思考 题 


编写 一 个 递归 函数 silly( )， 带 一 个 非 负 整数 作为 输入 参数 ， 输 出 n 个 问号 ， 后 跟 n 个 感叹 
号 。 要 求 程序 不 能 使 用 循环 。 

>>> silly(0) 

>>> silly(1) 

>>y silly(10) 

是 

编写 一 个 递归 忒 数 numones( )， 带 一 个 非 负 整数 n 作为 输入 参数 ,返回 n 的 二 进 制 表 示 中 1 
的 个 数 。 使 用 下 列 事实 : 1 的 个 数 等 于 n//2 (整数 除法 ) 表示 中 1 的 个 数 ， 如 果 n 是 奇数 ， 则 
加 1。 

>>> numOnes (0) 

0 

>>> numOnes (1) 

1 


>>> numOnes (14) 
3 


在 第 5 章 中 ,我 们 使 用 迭代 方法 开发 了 欧 几 里 得 最 大 公约 数 ( GCD) 算法 。 欧 几 里 得 算法 可 以 
很 自然 地 使 用 递归 方法 描述 : 
a $= 
a 
使 用 上 述 递 归 定 义 ， 实 现 递归 困 数 rgcd( )， 带 两 个 输入 参数 : 两 个 非 负 整数 a 和 b(a>b)。 
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返回 a 和 5。 的 最 大 公约 数 GCD: 


>>> TECA(D, 0) 

3 

>>> rgcd(18,12) 
6 


编写 函数 rem( ) ， 带 一 个 输入 参数 : 一 个 列表 (可 能 包含 重复 值 )， 返 回 一 个 删除 了 重复 值 的 
列表 副本 。 


>>> rem([4] ) 

[] 

>>> rem([4, 4]) 

[4] 

S53 Tem( [人 下， 全， 2 

[] 

> 
A 


你 打算 返回 故乡 并 打算 住 在 朋友 家 里 。 碰 巧 你 所 有 的 朋友 都 住 在 同一 条 街 上 。 为 了 提高 效率 ， 
你 打算 住 在 中 央 位 置 的 朋友 家 中 ， 即 满足 下 列 条 件 : 两 边 的 朋友 数量 相同 。 如 果 两 个 朋友 的 房 
子 符 合 这 个 标准 ， 则 选择 街道 地 址 较 小 的 朋友 的 房子 。 

编写 限 数 address ( ) ， 吾 一 个 输入 参数 : 一 个 街道 号 码 列 表 ， 返 回 你 打算 居住 的 号 三。 
>>> Sa 1 克 过 ] 
5S 
> addrese Cl[2, +L BS 7 
2 
> rss tT 1  ， 
3 


开发 一 个 递归 函数 tough( )， 和 市 两 个 非 负 整数 作为 输入 参数 ， 输 出 如 下 所 示 的 模式 。 提 示 : 
第 一 个 参数 表示 模式 的 缩 进 ， 而 第 二 个 参数 (永远 是 2 的 乘 攻 ) 表示 星 号 (“*”) 最 多 的 行 中 
星 号 的 数量 。 


>9% (0 QO) 
SDS FLO Ly 
* 
Sy 出 KG 玫 ) 
水 
冰冰 
水 
3 TO 二 


编写 一 个 递归 上 盟 数 base( ) ， 带 两 个 参数 : 一 个 非 负 整数 n 和 一 个 正 整数 bp(1<4b<10)， 输 
出 整数 n 的 b 进 制 表 示 。 


>>> base(0, 2) 
0 
>>> base(1, 2) 
1 
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>>> base(10，2) 
1010 
>>> base(10, 3) 
和 渤 


实现 浮 数 permutations ( ) ， 审 一 个 参数 : 一 个 列表 1st。 返 回 1st 的 所 有 排列 (因此 返回 
值 是 一 个 列表 的 列表 )。 使 用 递归 方法 实现 。 如 果 输 入 列表 1st 的 大 小 为 1 或 0， 直 接 返 回 一 
个 包含 列表 1st 的 列表 。 和 否则 ， 在 子 列表 1st[1:] 上 递归 调用 函数 以 获得 除了 1st[0] 以 外 
的 1st 所 有 项 的 所 有 排列 。 然 后 ， 对 于 每 个 这 样 的 排列 ( 即 列表 ) perm， 通 过 把 lst[0] 插 
和 人 到 perm 所 有 可 能 的 位 置 生 成 Lst 的 排列 。 

>>> permutations([1, 2]) 

ee 

>>> permutations([1，2，3]) 


LE 同 生 四 
>>> Permutations([1，2，3，4]) 
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让 
1 
[上 
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实现 男 数 anagrams ( ) ， 计 算 给 定单 词 的 字 恋 (anagram， 即 颠倒 字母 而 形成 的 字 )。 一 个 单词 
A 的 字谜 是 通过 重新 排列 单词 A 形成 的 单词 B。 例 如 ， 单 词 pot 是 单词 top 的 一 个 字谜 。 要 求 
函数 带 两 个 输入 参数 : 一 个 包含 单词 的 文件 和 一 个 单词 。 输 出 文件 中 是 输入 单词 的 字谜 的 所 有 
单词 。 在 下 一 个 示例 中 ， 使 用 文件 words .txt 作为 你 的 单词 文件 。 


>>> anagrams('words.txt', 'trace') 
crate 
cater 
react 


编写 一 个 困 数 pairsl()， 市 两 个 输入 参数 : 一 个 整数 列表 和 一 个 目标 整数 。 如 果 列 表 中 存在 
两 个 数 之 和 等 于 目标 整数 ， 则 返回 True ; 否则 返回 False。 要 求 程序 的 实现 使 用 岁 套 循环 检 
查 列表 中 的 所 有 数值 对 。 
Soy wairelitl4s 1 9 3 Hs 1 
True 
> pairsi([la, 1 9; 3 5], 11) 
False 
程序 完成 后 ， 重 新 实现 果 数 ， 首 先 排序 列表 ， 然 后 有 效 地 查找 数值 对 。 使 用 timinganalysis() 
应 用 程序 分 析 这 两 种 实现 的 运行 时 间 。( 郴 数 buildInput() 应 该 生成 一 个 元 组 ， 包 含 列 表 和 
整数 。) 
在 本 题 中 ， 我 们 将 开发 一 个 也 数 ， 抓 取 相互 “链接 ”的 文件 。 息 虫 程序 访问 的 每 个 文件 包含 零 
个 或 多 个 指向 其 他 文件 的 链接 (每 行 一 个 )， 没 有 别 的 内 容 。 指 向 一 个 文件 的 链接 仅仅 是 文件 
名 。 例 如 ,文件 file0 .txt 的 内 容 如 下 : 
filel.txt 
Fie2. tt 
第 一 行 表 示 指 同文 件 file1l .txt 的 链接 ， 第 二 行 表示 指向 文件 file2 .txt 的 链接 。 
实现 一 个 递归 晴 数 crawl( )， 和 市 一 个 输入 参数 : 一 个 文件 名 (字符 串 )。 输 出 信息 表示 正 
在 访问 该 文件 、 打 开 文 件 、 读 取 每 个 链接 ， 然 后 继续 递归 抓 取 每 个 链接 。 下 面 示例 使 用 了 压缩 
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文档 files .zip 中 的 一 系列 文件 。 


> craul ("fi160. txt ') 
Visiting file0.txt 
Visiting filel.txt 
Visiting file3.txt 
Visiting file4.txt 
Visiting file8.txt 
Visiting file9.txt 
Visiting file2.txt 
Visiting file5.txt 
Visiting file6.txt 
Visiting file7.txt 


Pascal 三 角形 是 一 个 无 限 的 二 维 数字 模式 ， 其 前 五 行 如 图 10-16 所 示 。 第 一 行 ( 行 0 ) 只 包含 
1。 所 有 其 他 的 行 以 1 开头 和 结尾 。 这 些 行 中 的 其 他 数字 使 用 如 下 规则 得 到 : 第 i 个 位 置 上 的 数 
字 是 上 一 行 中 的 位 置 二 1 和 位 置 i 的 数字 之 和 。 


图 10-16 ” Pascal 三角形。 其 中 仅仅 显示 了 Pascal 三 角形 的 前 5 行 


实现 递归 陋 数 pascalLine()， 市 一 个 非 负 整数 n 作为 输入 参数 ， 返 回 一 个 列表 ， 包含 
出 现在 Pascal 三 角形 中 第 n 行 的 数值 序列 。 


>>> pascalLine(0) 
[1] 

>>> pascalLine(2) 
bl By 

>>> pascalLine(3) 
[I 

>>> pascalLine(4) 
EP 


实现 递归 因数 traverse( ) ， 种 两 个 输入 参数 : 一 个 文件 夹 路 径 名 称 (字符 串 ) 和 一 个 整数 d。 
在 屏幕 上 输出 包含 在 文件 夹 (直接 包含 ， 或 间接 包含 ) 中 所 有 文件 和 子 文件 夹 的 路 径 名 称 。 要 
求 文件 和 子 文件 光路 径 名 称 的 输出 采用 缩 进 格式 ， 缩 进 与 其 相对 于 顶级 文件 夹 的 深度 成 正比 。 
如 下 示例 显示 了 traverse() 在 图 10-8 中 所 示 的 文件 夹 “test” 上 执行 的 结果 ， 


>>> traverse('test'; 0) 
test/fileA.txt 
test/folderl 
test/folderl/fileB.txt 
test/folderli/fileC.txt 
test/folderl/folderli 
test/folderl/folder1ll/fileD.txt 
test/folder2 
test/folder2/fileD.txt 
test/folder2/fileE.txt 


实现 滑 数 search( )， 带 两 个 输入 参数 : 一 个 文件 名 和 一 个 文件 夹 路 径 名 。 在 文件 夹 及 其 子 文 
件 夹 (直接 或 间接 ) 中 搜索 该 文件 。 如 果 搜 索 成 功 ， 则 要 求 困 数 返回 该 文件 的 路 径 名 ; 否则 ， 
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返回 None。 如 下 显示 了 在 图 10-8 所 示 的 父 文件 来“ test” 下 执行 search(' filer 
tt "i Ces ”) 的 结果 : 
33> Boarch("fileR., tt', test") 

test/folder2/fileE.txt 
Lévy 曲线 是 一 种 可 以 递归 定义 的 分 形 图 形 模 式 ， 类 似 于 科 赫 曲线 。 对 于 任何 非 负 整数 n > 0， 
Lévy 曲线 L, 可 以 使 用 Lévy 曲线 工 | 定义 ; Lévy 曲线 LL 是 一 条 直线 。 图 10-17 显示 了 Lévy 
曲线 L,。 


图 10-17 Lévy 曲线 L。 


(a) 从 互联 网 上 查找 有 关 Lévy 曲线 更 多 信息 ， 然 后 实现 递归 前 数 levy()， 带 一 个 非 负 整数 
作为 输入 参数 ; 返回 海 包 绘 图 指令 ， 指 令 采 用 字母 LN、R 和 下 编码 ， 其 中 工 表示 “向 左旋 
转 45 度 ”，R 表示 “ 回 右 旋 转 90 度 ",， 了 表示 “ 回 前 ”。 
>>> levy(0) 
IF 
>>> levy(1) 
ILFRFL ' 
>>> levy (2) 
'LLFRFLRLFRFLL ' 
(b) 实现 负数 azawLevy( )， 和 市 一 个 非 负 整数 n 作为 输入 参数 ， 使 用 也 数 levy ( ) 获得 的 指令 
绘制 Lévy 曲线 L,。 
在 简单 的 挪 便 币 游戏 中 ， 你 得 到 一 个 初始 的 硬币 数 ， 然 后 ， 在 游戏 的 每 一 次 迭代 中 ， 你 都 需要 
使 用 以 下 规则 之 一 来 去 挥 一定 数量 的 人 硬币。 如 果 n 是 你 所 拥有 的 硬币 的 数量 : 
e 如 果 n 可 以 被 10 整除 ， 则 可 以 交还 9 个 硬币 ; 
e 如 果 n 是 偶数 ， 则 可 以 精确 地 交还 w2-1 个 硬币 ; 
e 如 来 n 可 以 被 3 整除 ， 则 可 以 交还 7 个 人 硬币 ; 
e 如 来 n 可 以 被 4 整除 ， 则 可 以 交还 6 个 便 币 。 
如 采 没 有 规则 可 以 应 用 ， 你 就 输 了 。 这 个 游戏 的 目的 是 最 终 得 到 8 个 人 硬币 。 
注意 ， 对 于 nn 的 某 些 值 ， 可 以 应 用 不 止 一 条 规则 。 例 如 ， 假 如 等 于 20， 可 以 应 用 规 
则 1， 结果 为 11 个 便 币 。 但 是 ， 因 为 没有 规则 可 以 适用 于 11 个 硬币 ,你 就 会 输 掉 这 场 比 
赛 。 或 者 可 以 应 用 规则 4， 结 果 为 14 枚 硬币 。 然 后 应 用 规则 2， 结 果 为 8 枚 硬币 ， 最 终 赢得 
比赛 。 
编写 一 个 函数 coins ( ) ， 带 一 个 初始 硬币 数量 作为 输入 参数 ， 如 果 有 一 种 游戏 玩法 使 得 
结果 为 8 枚 便 币 ， 则 返回 True。 只 有 没有 任何 方法 赢得 游戏 时 ， 才 输出 False。 
>>> Coins (7) 
False 
>>> coins(8) 
True 


>>> coins(20) 
True 
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>>> coins(66) 

False 

>>> coins(99) 

True 

利用 线性 递归 ， 实 现 函 数 recDup( ) ， 带 一 个 列表 作为 输入 参数 ， 一 个 列表 副本 ， 其 中 每 
个 项 都 重复 了 一 

> ocDuptl "amt" ut "wut", dog]) 

[Liant" ant*, "Dab ‘buts ab', "vats "dp, "6g!| 

利用 线性 递归 ， 实 现 函 数 recReverse( ) ， 带 一 个 列表 作为 输入 参数 ， 返 回 列表 的 反 序 副本 。 


>>> 118 二 [4 3 5， 这 9] 
>>> recReverse(lst) 
-ee 


利用 线性 递归 ， 实 现 函 数 recSplit()， 带 两 个 输入 参数 : 一 个 列表 1st 和 一 个 非 负 整数 i 
(不 大 于 1st 的 大 小 )。 要 求 函数 将 列表 分 成 两 部 分 ， 以 便 第 二 部 分 正好 包含 列表 的 最 后 i 个 
项 。 图 数 应 该 返回 一 个 包含 两 部 分 的 列表 。 
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实现 一 个 图 数 ， 绘 制 如 下 所 示 的 正方 形 模式 : 


中 此 关上 
和 Er 
和 银 叶 
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(a) 首先 实现 函数 square( ) ， 带 四 个 输入 参数 : 一 个 Turtle 对 象 和 三 个 整数 x、y 和 s。 使 
用 Turtle 对 象 在 坐标 位 置 (x, y) 绘制 一 个 边 长 为 s 的 正方 形 。 

>>> from turtle import Screen, Turtle 

> 8 = Screen() 

>>> = Turtle() 

>>> t.pensize(2) 

>>> square(t，0，0，200)  # 绘制 正方 形 

现在 实现 递归 了 晴 数 squares () ， 其 参数 除了 包含 困 数 square 相同 的 参数 外 ， 再 增 
加 一 个 整数 n 参数， 绘制 一 个 正方 形 模 式 。 当 n= 0， 什 么 也 不 绘制 。 当 n= 1， 使 用 
square(t，0，0，200) 绘制 一 个 正方 形 。 当 n= 2， 绘制 模式 如 下 : 


(b 


TY 


四 个 小 正方 形 的 中 心 位 于 大 的 正方 形 的 顶点 ， 且 长 度 为 原始 正方 形 的 1/2.2。 当 n=3 时 ， 
绘制 模式 如 下 : 
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在 本 章 中 ， 我 们 将 介绍 万 维 网 ( World Wide Web， 或 者 简称 Web)。 万 维 网 是 计算 机 科 
学 中 最 重要 的 发 展 之 一 。 它 已 经 成 为 信息 共享 和 交流 的 首选 平台 。 因 此 ，Web 是 前 沿 应 用 程 
序 开发 的 丰富 来 源 。 

本 革 和 首先 描述 三 种 核心 的 WWW 技术 : 统一 资源 定位 器 (URL)、 超 文本 传输 协议 (HTTP ) 
和 超 文 本 标记 语言 (HTML)。 我 们 特别 关注 HTML， 它 是 网 页 的 语言 。 然 后 我 们 讨论 使 开发 
人 员 能 够 编写 访问 、 下 载 和 处 理 Web 文档 的 程序 的 标准 库 模块 。 我 们 特别 专注 于 掌握 诸如 
HTML 解析 顶 和 正则 表达 式 等 工具 ， 这 些 工 具有 助 于 我 们 处 理 网 页 和 分 析 文 本 文档 的 内 容 。 

本 草 和 下 一 草 所 教授 的 技能 对 于 挖掘 数据 文件 (如 Web 页 面 ) 和 开发 诸如 搜索 引擎 、 推 
存 系统 和 其 他 大 量 的 大 数据 应 用 程序 非常 有 用 。 


11.1 万 维 网 


万 维 网 是 通过 超 链接 对 文档 进行 相互 链接 的 分 布 式 系统 ， 并 托管 在 分 布 在 Internet 上 的 
Web 服务 各 上 。 在 本 方 中 ， 我们 将 解释 Web 是 如 何 工作 的 ， 并 描述 它 所 依赖 的 技术 。 我 们 
在 本 划 中 开发 的 基于 Web 的 应 用 程序 中 使 用 了 这 些 技术 。 


11.1.1 Web 服务 器 和 Web 客户 端 


如 前 所 述 ， 因 特 网 是 连接 世界 各 地 计算 机 的 全 球 网 络 。 它 允许 在 两 台 计 算 机 上 运行 的 程 
序 互相 发 送 消 息 。 典 型 地 ， 通 信和 是 因为 其 中 一 个 程序 向 另 一 个 程序 请 求 资源 (例如 ， 一 个 文 
件 )。 提 供 资 源 的 程序 称 为 服务 器 (承载 服务 器 程序 的 计算 机 也 经 常 被 称 为 服务 器 )。 请 求 资 
源 的 程序 被 称 为 客户 端 。 

WWW 包含 大 量 的 Web 页面、 文档 、 多 媒体 和 其 他 资源 。 这 些 资 源 存储 在 连接 到 
Internet 上 的 计算 机 上 ， 这 些 计算 机 运行 一 个 称 为 Web 服务 器 的 服务 需 程 序 。 网 页 是 Web 上 
尤其 关键 的 资源 ， 因 为 它们 包含 了 指向 Web 上 资源 的 超 链接 。 

从 Web 服务 需 请 求 资源 的 程序 称 为 Web 客户 端 。Web 服务 器 接收 请 求 并 将 请 求 的 资源 
(如 果 存 在 ) 发 送 回 客 户 端 。 

你 最 喜爱 的 浏览 锅 (无 论 是 Chrome 浏览 器 、Firefox 浏览 器 、Internet Explorer 浏览 器 
还 是 Safari 浏览 右 ) 都 是 Web 客户 端 。 浏 览 器 除了 能 够 请 求 和 接收 Web 资源 外 ， 还 具有 其 
他 功能 。 它 还 可 以 处 理 并 显示 资源 ， 无 论 资源 是 Web 页 面 、 文 本 文档 、 图 像 、 视 频 或 其 他 
多 媒体 。 最 重要 的 是 ，Web 浏览 器 显示 Web 页 面 中 包含 的 超 链接 ， 并 允许 用 户 通过 单 击 超 
链接 在 Web 页 面 之 间 进 行 导 航 。 


知识 拓展 : Web 简 史 
万 维 网 是 由 英国 计算 机 科学 家 带 姆 . 伯 纳 斯 一 李 (Tim Berners-Lee) 发 明 的 ， 当 时 他 
在 欧洲 核子 研究 组 织 (CERN) 工作 。 他 的 目标 是 创建 一 个 平台 ， 让 全 世界 的 粒子 物理 学 
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家 共享 电子 文档 。 有 史 以 来 第 一 个 网 站 在 1991 年 8 月 6 日 上 线 ， 其 网 址 为 : 

http://info.cern.ch/hypertext/WWW/TheProject.html 

网 络 迅 速成 为 科学 家 之 间 的 合作 工具 。 然 而 ， 直 到 Mosaic 网 络 浏览 器 (在 伊利 诺 伊 
大 学 厄 书 纳 一 香槟 ( Urbana-Champaign) 分 校 的 国家 超级 计算 应 用 中 心 ) 和 它 的 后 继 者 网 
景 (Netscape) 的 出 现 ， 其 使 用 范围 才 在 公众 中 爆炸 性 扩展 。 从 那 时 起 ， 网 络 已 经 取得 长 
足 的 发 展 。 到 2010 年 底 ， 谷歌 ( Google) 在 239 个 国家 的 服务 器 上 记录 了 大 约 180 亿 个 
不 重复 的 网 页 。 

万 维 网 联盟 (W3C) 是 由 伯 纳 斯 一 李 建 立 和 领导 的 ， 是 负责 开发 和 定义 WWW 标准 
的 国际 组 织 。 其 成 员 包 括 信息 技术 公司 、 非 营利 组 织 、 大 学 、 政 府 实体 和 来 自 世 界 各 地 的 
人 A 


11.1.2 WWW 的 “管道 ” 


为 了 编写 使 用 Web 资源 的 应 用 程序 ， 我 们 需要 更 多 地 了 解 Web 依赖 的 技术 。 在 我 们 讨 
论 它 们 之 前 ， 让 我 们 先 了 解 实现 Web 的 组 件 。 

为 了 请 求 一 个 Web 资源 ， 必 须 有 一 种 方法 来 识别 它 。 换 句 话 说 ，Web 上 的 每 个 资源 都 
必须 有 唯一 的 名 称 。 此 外 ， 必 须 找到 一 种 方法 来 定位 资源 。 更 确切 而 言 ， 必 须 存 在 一 种 定位 
资源 的 方法 ( 即 找 出 托管 资源 的 Internet 上 的 计算 机 主机 )。 因 此 ，Web 必须 有 一 个 命名 和 定 
位 器 方案 ， 人 允许 Web 客户 端 识别 和 定位 资源 。 

一 旦 定位 了 资源 ， 就 需要 有 一 种 方法 来 请 求 资源 。 仅 仅 发 送 类 似 “ 嘿 老兄 ， 把 那个 mp3 
给 我 ! ”的 消息 是 不 会 起 作用 的 。 客 户 闪 和 服务 需 程 序 必 须 使 用 约定 的 协议 进行 通信 ， 协 议 
精确 地 指定 Web 客户 端 和 Web 服务 需 分 别 应 该 如 何 格式 化 请 求 消息 和 应 答 消息 。 

Web 页 面 是 Web 上 的 关键 资源 。 它 们 包含 格式 化 信息 和 数据 和 人 允许 Web 冲浪 的 超 链 
接 。 为 了 指定 网 页 的 格式 并 包含 超 链 接 ， 需 要 有 一 种 语言 以 文 持 格式 指令 和 超 链接 定义 。 

这 三 个 组 件 (命名 方案 、 协 议和 Web 发 布 语言 ) 都 是 由 伯 纳 斯 - 李 开 发 的 ， 它 们 是 真正 
定义 WWW 的 技术 。 

11.1.3 ”命名 方案 : 统一 资源 定位 器 

为 了 识别 和 访问 Web 上 的 资源 ， 每 个 资源 必须 具有 唯一 标识 符 。 该 标识 符 称 为 统一 资 
源 定位 器 ( Uniform Resource Locator，URL)。URL 不 仅 唯 一 地 标识 资源 ， 而 且 指 定 如 何 访 
问 资源 ， 就 像 一 个 人 的 地 址 可 以 用 来 查找 此 人 一 样 。 例 如 ，W3C 的 任务 声明 文档 是 在 联盟 
的 网 站 上 托管 的 ， 它 的 URL 是 字符 串 : 

http://ww.w3.0rg/Consortium/mission.html 

此 字符 串 唯一 标识 W3C 任务 声明 文档 的 Web 资源 。 它 还 指定 了 访问 它 的 方式 ， 如 
图 11-1 所 示 。 


nttp :// Ww.wW3.oreg Consortituim/mission.htm] 
协议 主机 路 径 


图 11-1 一 个 URL 的 解剖 结构 。 一 个 URL 指定 资源 的 协议 (scheme)、 主 机 (host) 和 路 径 (path ) 


Web 布 规 笑 yy 


协议 指定 如 何 访问 资源 。 在 图 11-1 中 ， 协 议 是 我 们 稍 后 将 讨论 的 HTTP 协议。 主机 
(www.w3c.org) 指定 托管 文档 的 服务 需 的 名 称 ， 这 是 每 个 服务 硕 特 有 的 。 路 径 是 文档 的 相 
对 路 径 名 (参见 4.3 节 中 的 定义 )， 相 对 于 服务 硕 中 的 一 个 特殊 的 目录 ( 称 为 Web 服务 谷 根 
目录 )。 在 图 11-1 中 ， 路 径 是 /Consortium/mission.html。 

值得 注意 的 是 ，HTTP 协议 只 是 一 个 URL 可 指定 的 众多 协议 中 的 一 种 。 其 他 协议 包括 
HTTPS 协议 ( 它 是 HTTP 的 安全 ( 即 加 密 ) 版 本 )、FTP 协议 ( 它 是 在 因特网 上 传输 文件 的 标 
准 协议 ): 

https://webmail.cdm.depaul.edu/ 

ftp://ftp.server.net/ 

其 他 例子 包括 mailto 协议 和 file 协议 ， 例如: 

mailto:lperkovic@cs.depaul.edu 

file:///Users/lperkovic/ 

mailto 协议 打开 电子 邮件 客户 端 (如 微软 Outlook) 写 邮 件 (例如 ， 本 例 是 给 我 的 邮 
箱 发 邮件 )。file 协议 用 于 访问 本 地 文件 系统 中 的 文件 夹 或 文件 (例如 ,我 的 主 目录 : / 


Users/lperkovic/)。 


11.1.4 协议 : 超 文 本 传输 协议 


Web 服务 需 是 一 种 计算 机 程序 ， 它 根据 请 求 来 提供 Web 资源 服务 。Web 客户 病 是 发 送 
这 些 请 求 的 计算 机 程序 〈 例 如 ， 你 的 浏览 硕 )。 客 户 端 首先 打开 到 服务 需 的 网 络 连接 (与 打 
开 文件 和 /或 写 人 文件 一 样 )， 然 后 通过 网 络 连 接 回 服务 需 发 送 请 求 消息 (相当 于 写 人 文件 )。 
如 果 请 求 的 内 容 托管 在 服务 锅 上 ， 客 户 端 最 终 将 通过 网 络 连接 从 服务 硕 接 收 一 个 包含 所 请 求 
的 内 容 的 啊 应 消息 (相当 于 从 文件 中 读 取 )。 

一 旦 建立 网 络 连接 ， 客 户 端 和 服务 需 之 间 的 通信 调度 以 及 请 求 和 啊 应 消息 的 精确 格式 由 
超 文本 传输 协议 (HyperText Transfer Protocol，HTTP) 指定 。 

例如 ， 假 设 使 用 Web 浏览 带 通 过 下 列 URL 下 载 W3C 任务 声明 文档 : 

http://www.w3 .org/Consortium/mission.html 

浏览 盘问 主机 www.w3.org 发 送 的 消息 将 从 以 下 行 开始 : 

GET /Consortium/mission.html HTTP/1.1 

请 求 消息 的 第 一 行 称 为 请 求 行 。 请 求 行 必须 以 一 个 HTTP 方法 开始 。 方 法 GET 是 一 种 
HTTP 方法 ， 它 是 资源 请 求 的 通常 方式 。 接 下 来 是 散 入 在 资源 URL 中 的 路 径 ， 该 路 径 指 
请 求 的 资源 的 标识 和 相对 于 Web 服务 需 的 根 目 录 的 位 置 。 请 求 行 最 后 ete 
言 息 。 

请 求 消息 在 请 求 行 之 后 可 以 包含 额外 的 行 ， 被 称 为 请 求 头 字段 。 例 如 ， 这 些 头 字段 在 刚 
才 显 示 的 请 求 行 之 后 : 


Host: Wwww.w3.org 

User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; .. 
Accept: text/html,application/xhtml+xml ,application/xml;... 
Accept-Language: en-us,en;qdq=0.5 


请 求 头 字段 为 客户 提供 了 回 服 务 硕 发 送 更 多 有 关 请 求 的 信息 的 方法 ， 包 括 浏览 希 接 受 的 
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字符 编码 和 语言 (例如 英语 )、 缓 存 信息 ， 等 等 。 

当 Web 服务 天 接收 到 该 请 求 时 ， 它 使 用 请 求 行 中 出 现 的 路 径 查 找 请 求 的 文档 。 如 果 成 
功 ， 则 创建 包含 所 请 求 资 源 的 应 答 消 息 。 

应 答 消息 的 前 几 行 类 似 于 : 

HTTP/1.1 200 OK 

Date: Mon, 28 Feb 2011 18:44:55 GMT 


Server: Apache/2 
Last-Modified: Fri, 25 Feb 2011 04:22:57 GMT 


此 消息 的 第 一 行 称 为 响应 行 ， 表示 请 求 成 功 。 如 果 不 成 功 ， 将 出 现 错误 消息 。 其 余 的 
行 ， 称 为 响应 头 字 段 ， 癌 客户 端 提供 额外 的 信息 ， 例 如 服务 器 服务 响应 请 求 的 准确 时 间 、 所 
请 求 的 资源 上 次 修改 的 时 间 、 服 务 器 程序 的 “品牌 ”、 请 求 资源 的 字符 编码 等 。 

请 求 头 字段 之 后 是 请 求 的 资源 ， 在 我 们 的 示例 中 是 一 个 HTML 文档 (描述 W3 联盟 的 任 
务 声明 )。 如 果 收 到 这 个 响应 的 客户 端 是 一 个 Web 浏览 器 ， 它 将 使 用 HTML 代码 来 计算 文 
档 的 布局 ， 并 在 浏览 器 中 显示 格式 化 的 交互 式 文档 。 


11.1.5” 超 文本 标记 语言 
当 浏 览 硕 指 回 如 下 URL 时 : 
http://www.w3.0rg/Consortium/mission.html 
将 下 载 W3C 任务 声明 文档 mission.htm1l。 在 浏览 器 中 查看 时 ， 它 看 起 来 像 一 个 典型 的 
网 页 。 它 有 标题 、 段 落 、 列 表 、 超 链接 、 图 片 ， 所 有 这 些 都 被 整齐 排列 以 增加 “内 容 ” 的 可 
谈 性 。 然 而 ， 如 果 查 看 mission.html 文本 文件 的 实际 内 容 ， 你 会 看 到 如 下 内 容 : 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" ... 


<html xmlns="http://www.w3.o0org/1999/xhtml" xml:lang="en" ... 


<script type="text/javascript" src="/2008/site/js/main" .. 
</div></body></html> 


(仅仅 显示 了 文件 的 开 涉 和 结尾 部 分 。) 


知识 拓展 : 查看 网 页 源 文件 
可 以 查看 显示 在 浏览 器 中 文件 的 实际 内 容 。 例 如 ， 在 Firefox 中 可 以 通过 在 菜单 
【 View 】 然 后 选择 【 Page Source 】 查 看 ; 在 Internet Explorer 浏览 器 中 可 以 通过 菜单 
【 Page 】 然 后 选择 【 View Source 】 查 看 。 


文件 mission.html 是 所 显示 网 页 的 源 文件 。 网 页 源 文件 是 使 用 一 种 叫 作 超 文 本 标记 
语言 (HyperText Markup Language，HTML) 的 出 版 语言 编写 的 。HTML 语言 用 于 定义 网 页 
的 标题 、 列 表 、 图 像 和 超 链接 ， 并 将 视频 和 其 他 多 媒体 包含 在 其 中 。 
11.1.6 HTML 元素 


一 个 HTML 源 文件 是 由 HTML 元 素 组 成 。 每 个 元 素 定 义 关联 网 页 的 一 个 组 件 (例如 : 
标题 、 列 表 或 者 列表 项 、 图 像 或 者 超 链 接 )。 为 了 查看 HTML 源 文件 中 元 素 是 如 何 定 义 的 ， 
我 们 讨论 图 11-2 所 示 的 页 面 。 这 是 概述 W3C 任务 的 基本 网 页 。 
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[A W3C Mission Summary 4 
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图 11-2 网 页 w3c.html。 一 个 网 页 由 不 同类 型 的 HTML 元 素 组 成 。 元 素 hl 和 h2 指定 最 大 标 
题 和 第 二 大 标题 ，p 是 段落 元 素 ，br 是 换行 元 素 , ul 是 列表 元 素 ，1i 是 列表 项 元 素 ， 
a 是 锚 点 元 素 (用 于 指定 一 个 超 链 接 ) 


图 中 是 网 页 的 组 成 部 分 (不 同 大 小 的 标题 、 一 个 段落 、 一 个 列表 等 )， 对 应 文档 的 不 同 
元 素 。 我 们 实际 上 看 到 的 元 素 是 浏 览 需 解释 后 的 结果 。 实 际 的 元 素 定 义 在 网 页 源 文 件 中 : 


文件 : w3c.html 


1 <html> 
<head><title>W3C Mission summary</title></head> 
3 <body> 
| <h1>W3C Mission</h1> 
二 <p> 
The W3C mission is to lead the World Wide Web to its full 
potential<br>by developing protocols and guidelines that 


8 ensure the long-term growth of the Wehb， 
9 </p> 

10 <h2>Principles</h2> 

11 <ul> 


<li>Web for All</1i> 
13 <li>Web on Everything</1i> 
14 </ul> 
15 See the complete 
16 <a href="http://www.w3.org/Consortium/mission.html"> 
17 W3C Mission document 
18 </a>. 
19 </body> 
20 《</html> 


考虑 与 标题 “W3C Mission ”对 应 的 HTML 元 素 : 


<h1i>W3C Mission</h1> 


这 是 名 为 hl 的 最 大 标题 。 它 是 使 用 开始 标记 <h1> 和 结尾 标记 </h1l> 来 描述 的 。 中 间 所 
包含 的 文本 将 被 浏览 器 显示 为 一 个 大 标题 。 注 意 : 开始 标记 和 结束 标记 包含 元 素 名 称 ， 总 是 
使 用 < 和 > 括号 分 隅 开 来 ; 结束 标记 还 包含 一 个 反 斜 杠 。 

一 般 来 说 ，HTML 元 素 由 三 个 组 件 组 成 : 
1. 开始 标记 和 结束 标记 ; 
2. 开始 标记 中 的 可 选 属性 ; 
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3. 开始 标记 和 结束 标记 之 间 的 其 他 元 素 或 数据 。 
在 HTML 源 文件 w3c.html 中 ， 有 一 个 元 素 (title) 包含 在 男 一 个 元 素 (head) 中 的 
例子 : 


<head><title>W3C Mission Summary</title></head> 


任何 出 现在 开始 标记 和 结束 标记 之 间 的 元 素 被 称 为 包含 在 其 中 。 这 种 包含 关系 形成 了 
HTML 文档 各 元 素 之 间 的 树 状 层次 结构 。 


11.1.7 HTML 文档 的 树 结构 


HTML 文档 中 的 元 素 形成 与 文件 系统 树 层次 结构 (参见 第 4 章 ) 类 似 的 树 层 次 结构 。 每 
个 HTML 文档 的 根 元 素 必 须 是 html 元 素 。 元 素 html 包含 两 个 元 素 (都 是 可 选 元 素 ， 但 通常 
呈现 )。 第 一 个 是 元 素 head， 它 包含 文档 元 数据 信息 ， 例 如 title 元 素 (通常 包含 在 浏览 
文档 时 显示 在 浏览 带 窗 口 顶 部 的 文本 数据 )。 第 二 个 元 素 是 body， 它 包含 将 在 浏览 器 窗口 
中 显示 的 所 有 元 素 和 数据 。 

图 11-3 显示 了 文件 w3c.html 中 的 所 有 元 素 。 该 图 明确 显示 哪个 元 素 包 含 在 男 一 个 元 
素 之 中 ,结果 是 一 个 树 结 构 。 此 树 结构 和 HTML 元 素 一 起 决定 网 页 的 布局 。 


html 
' body 
head i AN a 
p h2 ul i 
1 W3C Mission document 
‘title  W3C Mission ~ Principles 一 
br li me- 
ee ee the complete 
W3C Mission TD ur PO Ws Web on Everything 


Web for All 
图 11-3 w3c.html 的 结构 。 一 个 HTML 文档 的 元 素 构 成 一 个 层次 树 结构 ， 指 定 内 容 如 何 组 
织 。 浏 览 器 使 用 元 素 和 层次 结构 来 产生 网 页 布局 。 


11.1.8 锚 点 HTML 元 素 和 绝对 链接 


HTML 锁 点 元 素 (a) 用 于 创建 超 链接 的 文本 。 在 源 文件 w3c.html 中 ， 我 们 按 下 列 方 
式 创 建 超 链接 文本 : 


<a href="http://www.w3.0org/Consortium/mission.html"> 
W3C Mission document 
</a> 


这 是 一 个 HTML 元 素 带 有 属性 的 示例 。 正 如 我 们 在 本 节 开 始 时 所 述 ， 元 素 的 开始 标记 
可 能 包含 一 个 或 多 个 属性 。 每 个 属性 在 开始 标记 中 分 配 一 个 值 。 锚 点 元 素 a 要 求 在 开始 标记 
中 包含 属性 href ，href 属性 的 值 应 该 是 链接 资源 的 URL。 在 我 们 的 例子 中 ， 链 接 资 源 为 : 

http://www.w3 .org/Consortium/mission.html 

这 个 URL 标识 包含 W3C 任务 声明 的 网 页 ， 托 管 在 服务 器 www.w3 .org 中 。 链 接 资源 
是 任何 可 以 用 URL 标识 的 内 容 : HTML 页 面 、 图 像 、 声 音 文件 、 电 影 等 。 

销 点 元 素 中 包含 的 文本 (例如 ， 文本“ W3C Mission document”) 是 浏览 器 中 显示 的 文 
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本 ， 无论 浏览 带 使 用 何 种 格式 显示 超 链接 。 在 图 11-2 中 ， 超 链接 的 文本 用 加 下 划 线 的 方式 
显示 。 当 点 击 超 链接 文本 时 ， 将 下 载 链接 的 资源 并 显示 在 浏览 吉 中 。 

在 我 们 的 例子 中 ， 在 超 链接 中 指定 的 URL 是 一 个 绝对 的 URL， 这 意味 着 它 显 式 地 指定 
一 个 URL 的 所 有 组 件 : 链接 资源 的 协议 、 主 机 和 完整 路 径 。 如 果 使 用 相同 的 协议 访问 链接 
资源 ， 并 且 存 储 在 与 包含 链接 的 HTML 文档 的 同一 主机 上 ， 则 可 以 使 用 URL 的 缩 略 版 本 ， 
我 们 将 在 随后 讨论 。 


11.1.9 相对 链接 

假设 要 查看 如 下 URL 的 网 页 的 源 文件 : 

http://www.w3.0rg/Consortium/mission.html 

在 其 中 发 现 了 一 个 锚 点 元 素 : 

<a href="/Consortium/facts.html ">Facts About W3C</a> 

注意 ， 属 性 href 的 值 不 是 一 个 完整 URL， 它 省 略 了 协议 和 主机 说 明 ， 只 包括 路 径 / 
Consortium/facts .html。 那 么 ，facts .html 文档 的 完整 URL 是 什么 ? 

/Consortium/facts.html 是 相对 URL。 因 为 它 包 含 在 如 下 URL 的 文档 中 : 

http://www.w3.0rg/Consortium/mission.html 

/Consortium/facts.html 相对 于 上 述 URL， 其 省 略 的 协议 和 主机 就 是 http 和 
www.w3 .org。 换言之 ， 网 页 /Consortium/facts .html 的 完整 URL 为 : 

http://www.w3.0rg/Consortium/facts.html 

下 面 是 即 一 个 示例 。 假 设 如 下 URL 的 文档 : 

http://www.w3.0rg/Consortium/mission.html 

包含 一 个 销 扩 : 

<a href=" facts.html ">Facts About W3C</a> 

那么 ，facts .html 的 完整 URL 是 什么 ?” 同样， 相对 URL facts .html 是 相对 于 包 
含 它 的 文档 的 URL， 即 相对 于 : 

http://www.w3.0rg/Consortium/mission.html 

换言之 ，facts .html 包含 在 主机 www.w3.org 中 的 有 目录 Consortium 下。 因此 ， 
其 完整 URL 为 : 

http://www.w3.0rg/Consortium/facts.html 


知识 拓展 : 学 习 更 多 关于 HTML 的 知识 
Web 开发 和 HTML 不 是 这 本 教科 书 的 重点 。 如 果 你 想 学 习 更 多 关于 HTML 的 知识 ， 
那么 Web 上 就 有 优秀 的 免费 资源 ， 尤 其 是 下 列 网 址 的 HTML 教程 : 
http://www.w3schools.com/html/default.asp 
该 教程 还 包括 一 个 交互 式 HTML 编辑 器 ， 它 允许 你 编写 HTML 代码 并 查看 结果 。 


11.2 Python WWW API 


在 前 两 节 ， 我 们 讨论 了 WWW 的 基本 概念 ， 讨 论 涉及 构成 万 维 网 的 “管道 ”的 三 个 关 
键 技 术 。 我 们 已 经 对 网 络 是 如 何 工 作 的 以 及 HTML 源 文 件 的 结构 有 了 一 个 基本 的 了 解 。 现 


322 常 11 章 


在 我 们 可 以 在 Python 应 用 程序 中 使 用 Web 了 。 在 本 节 中 ， 我 们 将 介绍 一 些 允 许 Python 开发 
人 员 访 问 和 处 理 Web 上 的 资源 的 标准 库 模 块 。 


11.2.1 模块 urllib.request 


我 们 通常 使 用 浏览 器 访问 Web 上 的 Web 页 面 。 然 而 ， 浏 览 硕 仅仅 是 一 种 类 型 的 Web 客 
户 端 ， 任 何 程序 都 可 以 作为 Web 客户 端 访 问 和 下 载 资 源 。 在 Python 中 ， 标 准 库 模块 urllib. 
request 给 开发 者 提供 了 这 种 能 力 。 该 模块 包含 限 数 和 类 ， 人 允许 Python 程序 以 类 似 于 打开 和 
读 取 文 件 的 方式 来 打开 和 读 取 Web 上 的 资源 。 

在 模块 ur11ib.request 中 的 艺 数 urlopen() 类 似 于 用 来 打开 (本地) 文件 的 内 置 
阴 数 open ( ) 。 然 而 ， 存 在 三 个 不 同 之 处 : 

1. urlopen() 市 一 个 URL 而 不 是 本 地 文件 路 径 名 作为 输入 参数 ; 

2. 它 会 将 HTTP 请 求 发 送 到 托管 内 容 的 Web 服务 需 ; 

3. 它 返回 一 个 完整 的 HTTP 啊 应 。 

在 下 面 的 例子 中 ,我 们 使 用 清 数 urlopen( ) 请 求 和 接收 托管 在 万 维 网 上 的 服务 右上 的 
下 

>>> from urllib.request import urlopen 

>>> response = urlopen('http://www.w3c.org/Consortium/facts.html') 


>>> type(response) 
<class 'http.client .HTTPResponse'> 


图 数 urzlopen() 返回 对 象 的 类 型 是 HttpResponse， 这 是 一 个 定义 在 标准 库 模块 
http.client 中 的 类 型 。 这 种 类 型 的 对 象 封 效 了 服务 硕 的 HTTP 啊 应 。 正 如 我 们 在 前 面 
看 到 的 ，HTTP 响应 包括 请 求 的 资源 ， 但 也 包括 附加 信息 。 例 如 ，HttpPResponse 方法 
getur1l() 返回 请 求 的 资源 的 URL: 


>>> response.geturl() 
'http://www.w3.0org/Consortium/facts.html' 


要 获得 所 有 HTTP 啊 应 头 字 段 ， 可 以 使 用 如 下 的 方法 getheaders ( ): 


>>> for field in response.getheaders() : 


print (field) 
(Date , Sat, 6 jul 201 09:40: 17 CMT’) 
('Server', 'Apache/2') 


('Lagt-Modified', 'Fri, 06 May 2011 01:59:40 GMT') 


Cpa ma, 'text/html; charset=utf-8') 

(省 略 了 部 分 头 字段 。) 

困 数 urlopen( ) 返回 的 HttpResponse 对 象 包含 请 求 的 资源 。HttpResponse 类 
被 称 为 一 个 类 文件 类 ， 因 为 它 支 持 方法 read()、readline() 和 readlines(), 与 打 
开 文 件 的 消 数 open( ) 返回 的 对 象 类 型 文 持 同样 的 方法 。 所 有 这 些 方法 都 检索 请 求 资 源 的 
内 容 。 例 如 ， 让 我 们 使 用 方法 read( ) : 

>>> html = response.read() 


>>> type (htm]l) 
<class 'bytes '> 
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方法 read( ) 将 返回 该 资源 的 内 容 。 例 如 ， 如 果 文 件 是 一 个 HTML 文档 ， 那 么 其 内 容 
被 返回 。 然 而 ， 请 注意 方法 read( ) 返回 一 个 bytes 类 型 的 对 象 。 这 是 因为 urlopen() 
打开 的 资源 可 能 是 音频 或 视频 文件 ( 即 二 0 urlopen() 的 默认 行为 是 假设 资源 是 

一 个 二 进 制 文件 ， 当 读 取 文件 时 ， 返 回 一 节 序 列 。 

如 果 资 源 恰好 是 一 个 HTML 文件 ei rim 那么 将 字 节 序列 解码 为 它们 所 表 
示 的 Unicode 字符 是 有 意义 的 。 我 们 使 用 bytes 类 的 decode() 方法 (在 6.3 节 中 讨论 ) 
来 实现 解码 : 

>>> html = html .decode() 

>>> html 


<IDOCTYPE tml PUBEIG "=//W3C//DID XHIME 1.0 Strict//ZEN" 
"http://www.w3.org/TR/xhtml1/DTD/xhtml1i-strict.dtd">\n 


</div></bodv></html>\n' 


(省 略 了 很 多 行内 容 。) 将 HTML 文档 解码 为 Unicode 字符 串 是 有 意义 的 ， 因 为 一 个 HTML 
文档 是 一 个 文本 文件 。 一 旦 解码 成 字符 串 ， 我 们 就 可 以 使 用 字符 串 运 算 符 和 方法 来 处 理 文 
档 。 例 如 ， 我 们 现在 可 以 找到 字符 串 “web” 出 现在 网 页 的 源 文件 中 的 次 数 。 
http://wwuw.w3c.org/Consortium/facts.html 
结果 如 下 : 
>>> html .count('Web') 
26 
基于 前 面 所 学 到 的 知识 ,我们 可 以 编写 一 个 函数 ， 市 一 个 输入 参数 : 网 页 的 URL， 
返回 网 页 的 源 文件 内 容 〈 作 为 一 个 字符 串 ): 


模块 : ch11.py 


from urllib.request import urlopen 
def getSource(ur]l): 
' 返回 URL 所 指定 的 资源 内 容 (作为 一 个 字符 串 )' 
4 response = urlopen(url]l) 
html = response.read() 
return html .decode() 


让 我 们 在 Google 网 页 上 测试 : 


>>> getSource('http://www.google.com') 

'<Idoctype html><html><head><meta http-equiv="content-type" 
content="text/html; charset=IS0-8859-1"><meta name="description" 
content="Search the world&#39;s information, including webpages, 


全 和风 国 编写 函数 news()， 带 两 个 参数 : 一 个 新 闻 网 站 的 URL 以 及 一 个 主题 
词 ( 即 字符 串 ) 的 列表 。 计 算 在 新 闻 中 每 个 主题 词 出 现 的 次 数 : 

>>> news('http://bbc.co.uk',['economy','climate','education']) 

economy appears 3 times. 


climate appears 3 times. 
education appears 1 times. 
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11.2.2 模块 html .parser 


模块 ur1l1lib .request 提供 用 来 在 万 维 网 上 请 求 和 下 载 资源 (如 网 页 ) 的 工具 。 如 果 
下 载 的 资源 是 一 个 HTML 文件 ,我 们 可 以 把 它 读 取 到 一 个 字符 串 ， 使 用 字符 串 运算 符 和 方 
法 进行 处 理 。 这 可 能 足以 回答 一 些 关 于 Web 页 面 内 容 的 问题 但是， 如 果 要 在 网 页 中 拾取 
与 锁 点 标记 相关 联 的 所 有 URL 呢 ? 

如 果 花 点 时 间 仔 细 思 考 ， 你 将 发 现 使 用 字符 串 运算 符 和 方法 来 查找 HTML 文件 中 的 所 
有 锚 点 标记 URL 会 相当 混乱 。 虽 然 我 们 很 清楚 需要 做 什么 : 遍历 文件 并 拾取 每 个 销 点 开始 
标记 的 href 属性 的 值 。 然 而 ， 要 做 到 这 一 点 ,我 们 需要 一 种 方法 来 识别 HTML 文件 的 不 
同 元 素 (文档 标题 、 文 字 标 题 、 链 接 、 图 像 、 文 本 数据 ， 等 等 )， 尤 其 是 锁 点 元 素 的 开始 标 
记 。 对 文档 进行 分 析 以 将 其 分 解 成 组 件 并 获取 其 结构 的 过 程 称 为 解析 。 

Python 标准 库 模 块 html .parser 提供 了 一 个 类 HTMLParser， 用 于 解析 HTML 文 
件 。 当 传递 一 个 HTML 文件 给 它 时 ， 它 将 从 头 到 尾 处 理 源 文件 ， 找 到 源 文 件 的 所 有 开始 标 
记 、 结 束 标 记 、 文 本 数据 和 其 他 组 件 ， 并 “处 理 ” 每 一 个 元 素 。 

为 了 说 明 HTMLParser 对 象 的 使 用 方法 并 描述 “处 理 过 程 ”的 含义 ,我 们 使 用 11.1 市 
中 的 HTML 文件 w3c .html。 

回顾 文件 w3c .html 的 开头 部 分 为 : 


文件 : w3c.html 
<html> 
<head><title>W3C Mission Summary</title></head> 
<body> 


<h1i>W3C Mission</h1> 


HTMLParser 类 支持 方法 feed( )， 市 一 个 输入 参数 : 一 个 HTML 源 文 件 的 内 容 ( 字 
符 串 形式 )。 因 此 ， 要 解析 w3c .html 文件 ,我 们 首先 要 把 该 文件 读 取 到 一 个 字符 串 中 ， 然 
后 传递 给 解析 丛 : 

>>> infile = open('w3c.html') 

>>> content = infile.read() 

>>> infile.close() 

>>> from html .parser import HTIMLParser 


>>> parser = HTMLParser() 
>>> parser.feed(content) 


当 执 行 最 后 一 行 语句 ( 即 当 字符 串 内 容 被 传递 到 解析 器 ) 时 ， 后 台 将 执行 下 列 处 理 : 解 

析 禹 将 字符 串 content 分 解 成 标记 符号 ， 对 应 于 HTML 开始 标记 、 结 束 标 记 、 文 本 数据 和 
其 他 HTML 组 件 ， 然 后 按照 它们 出 现在 源 文件 中 的 顺序 处 理 这 些 符 号 。 这 意味 着 ， 对 于 每 
个 符号 ， 调 用 适当 的 处 理 方法 。 这 些 处 理 方法 是 类 HTMLParser 的 方法 。 类 HTMLParser 
的 一 至 方 芒 殉 于 用 11 是。 
表 11-1 HTMLParser 处 理 方法 。 调 用 这 些 方法 时 不 会 执行 任何 操作 ， 需 要 重 载 这 些 方 法 实现 期 望 的 行为 

标 说 

<tag attrs> 开始 标记 处 理 方法 

</tag> 结束 标记 处 理 方法 

data 任意 文本 数据 处 理 方法 
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当 解 析 器 遇 到 一 个 开始 标记 符号 时 ， 调 用 标记 处 理 程 序 方法 handle _ starttag() ; 
如 果 解 析 需 遇 到 文本 数据 符号 ， 则 调用 处 理 程 序 方法 handle data()。 方 法 handle 
starttag( ) 带 两 个 输入 参数 : 开始 标签 元 素 名 称 和 一 个 包含 标签 属性 的 列表 (如 果 标 
签 不 包含 属性 则 为 None)。 每 个 属性 都 由 一 个 元 组 来 表示 ， 存 储 属 性 的 名 称 和 值 。 方 法 
handle_data() 只 包含 一 个 输入 参数 : 文本 数据 。 图 11-4 说 明了 解析 文件 w3c .html 的 
过 程 。 
符号 处 理 方法 


| — - -一 —» handle_starttag('html') 

本 - 一 一 — handle_data('\n ') 

a - 一 > handle_starttag('head') 

抽 - -> handle_data('') 

ali -> handle_starttag('title') 

v 'W3C Mission Summary' —> handle_data('W3CMission Summary') 
(tai -> handle_endtag('title') 


图 11-4 解析 HTML 文件 w3c.html。 按 出 现 顺序 处 理 各 标记 符号 。 第 一 个 符号 (开始 标记 
<html>) 调用 handle starttag() 处 理 。 下 一 个 符号 是 标记 <html> 和 <head> 
之 间 的 字符 串 ， 包 含 一 个 换行 待 和 一 个 空格 ， 被 看 作文 本 数据 ， 调 用 handle 
data( ) 处 理 


HTMLParser 类 处 理 方法 (如 handle starttag()) 究竟 执行 什么 操作 ? 好 吧 ， 什 
么 也 不 做 。 该 类 处 理 方法 的 实现 什么 也 不 做 。 这 就 是 我 们 执行 时 没有 什么 有 趣 的 事情 发 生 的 
原因 : 

>>> parser.feed(content) 

HTMLParser 类 处 理 方法 实际 上 旨 在 被 用 户 自 定义 处 理 程序 重 载 ， 实 现 程序 员 期 望 的 
行为 。 换 言 之 ， 类 HTMLParser 不 应 该 直接 使 用 ， 而 是 作为 一 个 超 类 ， 开 发 人 员 从 该 类 派 
生出 一 个 解析 带 解 析 ， 实 现 程 序 员 期 望 的 行为 。 


11.2.3” 重 载 HTMLParser 处 理 程 序 


让 我 们 开发 一 个 解析 硕 ， 输 出 传递 给 解释 融 的 HTML 文件 中 的 每 个 锚 点 开始 标记 的 
href 属性 的 URL 值 。 要 实现 此 行为 ， 需 要 被 重 写 的 HTMLParsez 处 理 方法 是 handle 
starttag( ) 方法 。 请 记 住 ， 该 方法 处 理 每 个 开始 标记 符号 。 现 在 我 们 希望 该 方法 需要 检 
查 输入 标记 是 否 是 一 个 销 点 标记 。 如 末 是 销 点 标记 ， 则 从 属性 列表 中 查找 href 属性 ， 并 输 
出 其 值 。 我 们 的 LinkParser 类 的 实现 代码 如 下 所 示 : 


模块 : ch11.py 


from html .parser import HIMLParser 
class LinkParser (HTMLParser): 
'''HTML 文档 解析 器 ， 输 出 
锚 点 开始 标记 的 href 属性 值 '…' 


def handle_starttag(self, tag, attrs): 
' 如 果 有 ， 则 打印 href 属性 值 ， 


if tag == 'a':# 如 果 是 锚 点 标签 


# 搜索 href 属性 并 且 打 印 其 值 
For datty 1 attre: 
if attr[0] == href ': 
14 print (attr[1]) 


注意 ， 在 第 12 行 到 第 14 行 ， 我 们 从 属性 列表 中 查找 属性 href。 让 我 们 基于 下 面 
HTML 文件 测试 我 们 的 解析 器 : 


文件 : links.html 


<html> 

2 <body> 

3 <h4>Absolute HTTP link</h4> 

4 <a href="http://www.google.com">Absolute link to Google</a> 

5 <h4>Relative HTTP link</h4> 

6 <a href="w3c.html">Relative link to w3c.html .</a> 
<h4>mailto scheme</h4> 

s <a href="mailto:me@Qexample.net">Click here to email me.</a> 
</body> 
</html> 


HTML 文件 links .html 中 包含 三 个 锚 点 标记 : 第 一 个 包含 指 问 Google 超 链接 的 
URL， 第 二 个 包含 指向 本 地 文件 w3c .html 链接 的 URL， 第 三 个 包含 实际 上 启动 邮件 客户 
端的 URL。 在 下 面 代码 中 ， 我 们 把 该 文件 传递 给 我 们 的 解析 器 并 获得 这 三 个 URL: 


>>> infile = open('links.html') 
>>> Content = infile.read() 

>>> infile.close() 

>>> linkparser = LinkParser() 
>>> linkparser.feed(content) 
http://www.google.com 
test.html 
mailto:me@Qexample.net 


开发 类 MyHTMLParser， 作 为 HTMLParser 的 子 类 ， 当 传递 一 个 
HTML 文件 给 它 时 ， 按 照 文 档 中 出 现 的 顺序 打印 开始 标记 和 结束 标记 的 名 称 ， 并 且 缩 进 与 文 
档 树 结 构 中 的 元 素 深 度 成 比例 。 忽 略 不 需要 结束 标记 的 HTML 元 素 ， 如 P 和 Pbr。 


>>> infile = open('w3c.html') 
>>> content = infile.read() 
>>> infile.close() 
>>> myparser = MyHTMLParser() 
>>> myparser.feed(content) 
htm] start 
head start 
title start 
title end 
head end 
body start 
nl Start 
hi end 
h2 start 
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h2 end 
ul start 
4 Eart 


a end 
body end 
html end 


11.2.4 模块 urllib.parse 


我 们 刚刚 开发 的 LinkParser 输出 每 个 销 点 的 href 属性 的 URL 值 。 例 如 ， 当 我 们 使 
用 “W3C 任务 ”网 页 运行 下 列 代码 时 : 

>>> rsrce = urlopen('http://www.w3.o0org/Consortium/mission.htm]l') 

>>> Content = rsrce.read() .decode() 


>>> linkparser = LinkParser() 
>>> linkparser.feed(content) 


我 们 获得 包含 相对 HTTP URL 的 输出 结果 ， 例 如 : 
/Consortium/contact .html 


绝对 HTTP URL 输出 结果 ， 例 如 : 
http://twitter.com/W3C 


还 有 非 HTTP URL 输出 结果 ， 例 如 : 
mailto:site-comments@w3.org 


(我 们 省 略 了 大 多 数 输出 行 。) 

如 果 我 们 只 对 与 HTTP 超 链接 相对 应 的 URL ( 即 协 议 是 HTTP 协 议 的 URL) 感 兴 
趣 呢 ? 请 注意 ， 我 们 不 能 说 “收集 以 字符 串 HTTP 开头 的 URL"， 因 为 我 们 会 遗漏 相 
对 URL (例如 ，/Consortium/contact.html)。 我 们 要 做 的 就 是 从 一 个 相对 URL 
(例如 ，/Consortium/contact.html) 和 包含 它 的 网 页 (http://www.w3.org/ 
Consortium/mission.html) 构造 一 个 绝对 URL。 

Python 标准 库 模块 urllib.parse 提供 了 在 干 处 理 URL 的 方法 ， 其 中 包含 正好 符合 
上 述 要 求 的 方法 urljoin()， 其 示例 用 法 如 下 所 示 : 

>>> from urllib.parse import urljoin 

>>> url = 'http://www.w3.0org/Consortium/mission.htm]l' 

>>> relative = '/Consortium/contact .html， 


>>> urljoin(url, relative) 
'http://www.w3.o0org/Consortium/contact .html' 


11.2.5 ”收集 HTTP 超 链 接 的 解析 器 


接 下 来 我 们 开发 男 一 个 版 本 的 LinkParser 类 ， 称 之 为 Collector。 它 只 收集 HTTP 
URL， 并 将 它们 放 入 列表 中 ， 而 不 是 输出 它们 。 列 表 中 的 URL 将 是 绝对 URL， 而 不 是 相对 
URL 格式 。 最 后 ， 要 求 该 类 文 持 方 法 getLinks()， 返回 该 列表 。 

我 们 期 望 collector 解析 佑 的 示例 用 法 如 下 所 示 : 
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>>> url = 'http://www.w3.o0org/Consortium/mission.html' 
>>> resource = urlopen(ur]l) 
>>> content = resource.read() .decode() 
>>> collector = Collector(url) 
>>> collector.feed(content) 
>>> for link in collector.getLinks() : 
print (link) 


http://www.w3.org/ 
http://wwuw.w3.0org/standards/ 


http://www.w3.org/Consortium/Legal/ipr-notice 


(同样 ， 省 略 了 许多 输出 行 ， 它 们 都 是 绝对 URL。) 

要 实现 collector， 同 样 我 们 需要 重 载 handle starttag()。 处 理 方法 不 是 简单 
地 输出 开始 标记 中 href 属性 的 值 (如 果 有 的 话 )， 还 必须 处 理 属 性 值 ， 以 保证 仅仅 收集 绝对 
的 HTTP URL, 

因此 ， 针 对 待 处 理 的 每 一 个 href 值 ， 处 理 方法 需要 执行 下 列 操作 : 

1. 把 href 值 转换 为 绝对 URL; 

2. 如 果 结 果 是 一 个 HTTP URL， 则 附加 到 一 个 列表 中 。 

为 了 实现 第 一 步 ， 处 理 方 法 必须 获得 传递 给 它 的 HTML 文 件 的 URL。 因 此 ， 
Collector 解析 咒 对 象 必须 有 一 个 实例 变量 存储 URL。 该 URL 必须 以 某 种 方式 传递 给 
Collector 对 象 ， 我 们 选择 将 URL 作为 Collector 构造 阴 数 输入 参数 的 方法 传递 URL。 

为 了 实现 第 二 步 ， 我 们 必须 有 一 个 1ist 实例 变量 以 存储 所 有 的 URL。 在 构造 哨 数 中 
必须 初始 化 1ist。Collector 类 的 完整 实现 代码 如 下 : 


模块 : ch11.py 


from urllib.parse import urljoin 
from html .parser import HTIMLParser 
class Collector (HTMLParser): 

' 将 超 链接 URL 收集 并 存储 到 一 个 列表 中 ， 


def init {self, wrl) 
' 初始 化 解析 器 、url 以 及 列表 ， 
HTMLParser.__init__(self) 
9 self.url = url 
10 self.links = [] 


12 def handle_starttag(self, tag, attrs): 
E ' 采用 绝对 路 径 格 式 收集 超 链接 URL' 


区 if tag == "a': 
for attr in attrs: 
6 if Sttel0)] se brer*: 
17 # 构造 绝对 路 径 URL 
1 absolute = urljoin(self.url, attr{[1]) 
if absolute[:4] == ' http ': # 收集 HTTP URL 


20 self.links.append(absolute) 


def getLinks(self): 
' 采用 绝对 路 径 格 式 返 回 超 链 接 URL 


24 return self. links 
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上 ;党 2 区 局 风 戎 ” 扩 展 类 Collector 的 功能 ， 使 得 它 可 以 收集 所 有 的 文本 数据 到 一 个 字 
符 串 ， 可 以 使 用 方法 getData() 获得 收集 的 文本 数据 。 


>>> url = 'http://Lwww.W3.org/Consortium/mission .html， 
>>> resource = Urlopen(ur1l) 

>>> Content = Tesource.read() .decode'() 

>>> collector = LinksCollector (url) 

>>> collector.feed(content) 

>>> collector.getData() 


'\nW3C Mission\n 


(仅仅 显示 了 少数 几 个 字符 ,) 


11.3 字符 串 模 式 匹 配 


假设 我 们 希望 开发 一 个 应 用 程序 ， 用 于 分 析 网 页 或 其 他 文本 文件 的 内 容 ， 并 查找 页 面 中 
的 所 有 电子 邮件 地 址 。 字 符 串 方法 find() 只 能 找到 特定 的 电子 邮件 地 址 ， 它 不 适合 查找 
“看 起 来 像 电 子 邮 件 地 址 ”或 者 和 一 个 邮件 地 址 模式 匹配 的 所 有 子 字符 串 。 

为 了 挖掘 网 页 或 其 他 文本 文档 的 文本 内 容 ， 我 们 震 要 一 种 工具 ， 可 以 帮助 我 们 定义 文本 
模式 并 在 文本 中 搜索 与 这 些 文本 模式 匹配 的 字符 串 。 在 本 节 中 ， 我 们 将 介绍 用 于 描述 字符 串 
模式 的 正则 表达 式 。 我 们 还 介绍 了 在 文本 中 查找 与 给 定 字符 串 模 式 匹配 的 字符 串 的 Python 
Ts 


11.3.1 正则 表达 式 


如 何 识别 文本 文件 中 的 电子 邮件 地 址 ? 我 们 通常 不 觉得 这 很 难 。 我 们 理解 电子 邮件 地 址 
仁和 件 如 下 字符 串 模式 : 
电子 邮件 地 址 由 用 户 ID( 即 一 个 “允许 ”的 字符 序列 )， 后跟 @ 符号 ， 后 跟 一 个 主机 名 
( 即 用 英文 句点 分 隅 的 “人 允许 ”的 字符 序列 )。 
虽然 这 个 非 正式 的 电子 邮件 地 址 的 字符 串 模式 描述 可 能 对 我 们 有 用 ,但 是 它 不 够 精确 ， 
不 足以 在 程序 中 使 用 。 
计算 机 科学 家 已 经 开发 出 一 种 更 正式 的 方法 来 描述 字符 串 模 式 ， 正则 表达 式 。 正 则 表达 
式 是 由 字符 和 正则 表达 式 运算 符 组 成 的 字符 串 。 我 们 现在 将 学 习 其 中 的 一 些 运算 符 ， 以 及 它 
们 如 何 使 我 们 能 够 精确 地 定义 所 需 的 字符 串 模式 。 
最 简单 的 正则 表达 式 是 不 使 用 任何 正则 表达 式 运算 符 的 表达 式 。 例 如 ， 正 则 表达 式 
best 只 匹配 一 个 字符 串 ， 字符 串 'best ' : 
正则 表达 式 匹配 的 字符 串 
best best 
运算 答 .〈 英 文句 点 ) 是 一 种 通 配 字 符 : 它 匹 配 除 换行 符 ('\n' ) 以 外 的 任意 Unicode 
字 和 伯 。 因 此 ，'be.t' 匹配 best， 同 时 还 匹配 'belt' 、'beet'、'be3t' 和 'bel!t'， 
等 等 : 
正则 表达 式 匹配 的 字符 串 
be.t best, belt, beet, bezt, be3t, be!t, be t,... 


注意 ， 正 则 表达 式 be .t 不 匹配 字符 串 ' bet' ， 因 为 运算 符 ' .' 必须 匹配 一 个 字符 。 
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正则 表达 式 运 算 符 *、+ 和 ? 匹配 前 一 个 字符 (或 正则 表达 式 ) 的 特定 重复 次 数 。 例 如 ， 
正则 表达 式 bext 中 的 运算 符 * 与 前 一 个 字符 (e) 的 0 次 或 多 次 重复 匹配 。 因 此 ， 它 匹配 
bt ， 也 匹配 bet 、beet 等 : 


正则 表达 式 匹配 的 字符 串 
be*t bt, bet, beet, beeet, beeeet, … 
be+tt bet, beet, beeet, beeeet, … 
bee?t bet, beet 


上 一 个 例子 还 说 明 运 算 符 + 匹配 前 一 个 字符 (或 正则 表达 式 ) 的 一 次 或 多 次 重复 ， 而 ? 
匹配 0 次 或 1 次 重复 。 

运算 符 [ ] 匹配 方 括 号 中 列 出 的 任意 一 个 字符 。 例 如 ， 正 则 表达 式 [abc ] 匹配 字符 串 
a、b 和 c, 但 不 匹配 其 他 字符 串 。 在 运算 符 [ ] 中 使 用 运算 符 - 时 ， 指 定 字 符 的 范围 。 此 范 
围 由 Unicode 字符 排序 指定 。 所 以 正则 表达 式 [1-o] 匹配 字符 串 1、m、n 和 o。 


正则 表达 式 匹配 的 字符 串 

be[ls]t belt, best 

be[l-o]t belt, bemt, bent, beot 
be[a-cx-z]t beat, bebt, bect, bext, beyt, bezt 


为 了 匹配 不 在 给 定 范 围 或 者 不 在 指定 集合 的 一 组 字符 ， 可 以 使 用 插入 字符 ^。 例 如 ， 
[ ^ 0-9 ] 匹配 任何 不 是 数字 的 字符 : 


正则 表达 式 匹配 的 字符 串 
be[~0-9]t belt, best, be#t,…( 但 不 匹配 be4t) 
be [~xyz]t belt, be5t,…( 但 不 匹配 bext、beyt 和 bezt) 
be [~a-ZA-2ZJ]t be!t, be5t, be 七 …( 但 不 匹配 beat) 


运算 符 | 是 “或 ”运算 符 : 如 果 A 和 B 是 两 个 正则 表达 式 ， 则 A|B 匹配 任何 A 或 B 匹 
配 的 字符 串 。 例 如 ， 正 则 表达 式 hello|Hello 匹配 字符 串 'hello' 和 'Hello': 


正则 表达 式 匹配 的 字符 串 
hello|Hello hello, Hello 
a+|b+ a, b, aa, bb, aaa, bbb, aaaa, bbbb, … 
ab+|ba+ ab，abb，abbb，… ， 以 及 ba，baa，baaa，… 


我 们 刚刚 讨论 的 运算 符 总 结 在 表 11-2。 


知识 拓展 : 其 他 正则 表达 式 运 算 符 
Python 支持 更 多 的 正则 表达 式 运 算 符 。 在 这 一 节 中 ， 我 们 只 触及 了 表面 。 要 了 解 更 
多 关于 正则 表达 式 运 算 符 的 知识 ， 请 阅读 大 量 的 在 线 文档 : 


http://docs.python.org/py3k/howto/regex.html 
以 及 
http://docs.python.org/py3k/library/re.html 


下 列 列表 中 给 出 了 一 个 正则 表达 式 和 若干 字符 串 。 请 选择 与 正则 表达 式 
匹配 的 字符 串 。 


表 11-2 正则 表达 式 运 算 符 。 运 算 符 .、 
运算 符 | 作用 于 正则 表达 式 中 该 
运 算 符 说 
匹配 除 换行 符 之 外 的 任意 字符 
匹配 其 正 前 面 的 正则 表达 式 0 次 或 多 次 。 
b) 的 0 次 或 多 次 
， 匹配 其 正 前 面 的 正则 表达 式 的 1 次 或 多 次 
? 匹配 其 正 前 面 的 正则 表达 式 的 0 次 或 1 次 
村 匹配 方 括号 中 字符 集 的 任意 字符 ; 
一 个 字符 范围 
如 果 $ 是 一 个 字符 集 或 字符 范围 ， 
| 如 果 A 和 B 是 正则 表达 式 ， 
由 于 运算 符 *、 
特 '*',，'.',， 或 '['。 为 了 匹配 有 特殊 含义 的 字符 ， 
则 表达 式 \*\[ 将 匹配 字符 串 '*['。 
表达 式 特 殊 序 列 。 
的 正则 表达 式 特殊 序列 。 
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正则 表达 式 字符 串 
(a) [Hhlello ello, Hello, hello 
(b)re-?sign re-sign, resign, re-?sign 
(c)[a-z]* aaa, Hello, F]16, IBM, best 
(d)[“a-z]* aaa, Hello, F16, IBM, best 
(e)<.*> 1 Se 


*、? 作用 于 正则 表达 式 中 该 
运算 符 的 左右 两 个 项 


可 以 使 用 第 一 个 字符 和 最 


运算 符 的 前 一 个 项 。 


明 


因此 ， 在 正则 表达 式 ab* 中 ,运算 待 * 匹配 b (而 不 是 


后 一 个 字符 中 间 加 一 个 -， 来 指定 


则 [^S] 匹配 任何 不 在 $ 中 的 字符 
则 AIB 匹配 任何 匹配 A 或 B 的 字符 串 


.、 和 [在 正则 表达 式 中 有 特殊 含义 ， 因 此 它们 不 能 用 来 匹配 字 


必须 使 用 转 义 序列 \。 因 此 ， 例 如 正 


除了 可 以 作为 转 义 字符 ， 肥 冬 杠 (\) 还 可 以 表示 正则 
正则 表达 式 特殊 序列 表示 常用 的 预定 义 字 符 集 。 表 11-3 列举 了 一 些 常 


削 用 


表 11-3 特殊 的 正则 表达 式 序列 。 注 意 ， 表 中 的 转 义 序列 仅 用 于 正则 表达 式 中 ， 它 们 不 能 


用 于 一 个 任意 的 字符 串 中 


运 算 符 说 。 明 
Na 匹配 任意 十 进 制 数字 ， 等 价 于 [0-9 ] 
\D 匹配 任意 非 数字 字符 ， 等 价 于 [^0-9] 
\s 匹配 任意 空白 字符 ,包括 空格 、 制 表 符 \t、 换 行 符 \n、 回 车 符 \r 
NS 匹配 任意 非 空白 字符 串 
\w 匹配 任意 字母 数字 字符 ， 等 价 于 [a-zA-20-9_] 
\W 匹配 任意 非 字 母 数 字 字 符 ， 等 价 于 [^a-zA-20-9_] 


9 为 下 列 每 个 非 正 式 模式 描述 或 者 一 组 字符 串 定义 一 个 正则 表达 式 ， 要 求 
仅仅 匹配 模式 描述 或 者 匹配 字符 串 集合 中 所 有 字符 串 。 


(a) aac, abc, 


(b) abc, xyz 


acCc 


(B) a ab, asb,. abbb, abbsb. 


(d) 包含 字母 表 (a， 
(e) 包含 


b，c，…，z) 中 小 写字 母 的 非 空 字 符 串 


子 字 符 串 oe 的 子 字 符 串 


(f) 表示 HTML 开始 或 结束 标记 的 字符 串 


11.3.2 ”Python 标准 库 模 块 re 


标准 库 中 的 模块 re 是 用 于 正则 表达 式 处 理 的 Python 工具 。 模 块 中 定义 的 一 个 果 数 是 
findal1()， 带 两 个 输入 参数 : 一 个 正则 表达 式 和 一 个 字符 串 ， 返 回答 和 字符 串 中 匹配 正 
则 表达 式 的 所 有 子 字 符 串 的 列表 。 一 些 示 例如 下 : 

>>> from re import findall 

>>> findall('best', 'beetbtbelt?bet, best') 

['best'] 

>>> findall('be.t', 'beetbtbelt?bet, best') 

[beet', "Delt’ , Deat"] 

>>> findall('be?t', ‘Weetbtbelt?bet, best",) 

Ly ‘bet 

>>> findall('be*t', 'beetbtbelt?bet, best') 

['beet', ‘bt ‘bat'| 

>>> findall('be+t', 'beetbtbelt?bet, best') 

['beet'., 'bet'] 


如 果 正 则 表达 式 匹 配 两 个 子 字 符 串 ， 其 中 一 个 包含 在 男 一 个 中 ， 则 函数 findal1() 仅 
匹配 长 的 子 字 符 串 。 例 如 : 

>>> findall('e+', ‘beeeetbet bt') 

['eeee', 'e'] 
返回 列表 中 没有 包含 子 字 符 串 ' ee' 和 'eee'。 如 果 正 则 表达 式 匹 配 两 个 重 至 的 子 字 符 串 ， 
则 函数 findall() 返回 左边 的 一 人 个。 事实 上 ， 函 数 findall() 从 左 到 右 扫 描 输入 学 符 串 
并 按 查 找到 的 顺序 收集 匹配 结果 到 一 个 列表 。 验 证 如 下 : 


>>> findall('{[*btj]+!:, 'beetbtbelt?bet, best') 
['ee', 和 i Gt, p> 'es'] 


下 面 是 男 一 个 例子 : 


>>> findall('[bt]+*, 'beetbtbelt?bet,; best') 
LR Et i np", Pi i VE | 


注意 事项 : 空 字符 串 无 处 不 在 
把 上 一 个 例子 和 本 例 进行 比较 : 
>>> findall(' [bt]*', 'beetbtbelt?bet, best') 
Lab. A TY 'tbtb"', 和 ee 5 二 人 tt! 
fb pr PD 人 


号 
》 和 3 


因为 正则 表达 式 [bt]* 匹 配 空 字符 串 "， 因 此 函数 findal1l() 在 输入 字符 
串 'beetbtbelt?bet， best' (不 包含 长 的 匹配 子 字 符 串 ) 中 查找 空 字 符 串 。 结 果 发 
现 许 多 空 字 符 串 ， 每 个 非 b 或 七 的 字符 前 面 都 发 现 一 个 空 字 符 串 。 包 括 第 一 个 b 和 第 一 
个 e 之 间 的 空 字符 串 ， 第 一 个 e 和 第 二 个 e 之 间 的 空 字符 串 等 。 


EE 二 开发 巴 数 frequency()， 带 一 个 字符 串 作为 输入 参数 ， 计 算 每 个 单词 
在 字符 串 中 出 现 的 频率 ， 返 回 一 个 字典 ， 把 字符 串 中 的 单词 映射 到 其 频率 。 要 求 使 用 一 个 正 


Web 矶 规 笑 了 33 


则 表达 式 来 获得 字符 串 中 所 有 的 单词 列表 。 


>>> content = 'The pure and simple truth is rarely Pure and never\ 
simple.' 

>>> frequency(content) 

人 

二 


一 个 定义 在 模块 re 中 有 用 的 孔 数 是 search( )。 它 同样 带 两 个 参数 : 一 个 正则 表 
达 式 和 一 个 字符 串 。 它 返回 匹配 正则 表达 式 的 第 一 个 子 字符 串 。 可 以 认为 它 是 字符 串 方 法 
find() 的 更 强大 版 本 。 示 例如 下 : 


>>> from re import search 

>>> match = search('e+', 'beetbtbelt?bet') 
>>> type (match) 

<class '_sre.SRE_Match'> 


咕 数 search() 返回 一 个 指 问 类 型 为 SRE Match 的 对 象 的 引用 ， 非 正式 地 称 之 为 
匹配 对 象 。 例 如 ， 该 类 型 支持 查找 匹配 子 字符 串 在 输入 字符 串 中 的 开始 索引 和 结束 索引 的 
方法 : 

>>> match.start() 
1 


>>> match.end() 
3 


'beetbtbelt?bet' 的 匹配 子 字符 串 从 索引 1 开始 到 索引 3 之 前 结束 。 匹 配对 象 还 有 
一 个 被 称 为 string 的 属性 变量 ， 用 于 存储 被 查找 的 字符 串 : 


>>> match.string 
!'beetbtbelt?bet, best' 


要 查找 匹配 的 子 字 符 串 ， 我 们 需要 获取 match.string 从 索引 match.start() 到 
索引 match .end( ) 的 切片 : 


>>> match.string[match.start():match.end()] 


' Ge" 


11.4 ”电子 教程 案例 研究 : Web 扑 虫 


在 案例 研究 CS.11 中 ,我 们 应 用 递归 以 及 我 们 在 本 章 和 掌握 的 知识 开发 一 个 基本 的 Web 
息 虫 ， 即 一 个 可 以 跟踪 超 链 接 从 而 系统 访问 网 页 的 程序 。Web 怜 虫 通过 跟踪 超 链接 和 下 载 相 
关 网 页 ， 解 析 其 内 容 ， 收 集 内 容 数据 ， 然 后 为 Web 页 面 中 的 每 一 个 超 链接 递归 地 重复 这 一 
工作 。 疏 虫 的 递归 算法 是 深度 优先 搜索 (一 个 基本 的 搜索 算法 ) 的 一 个 例子 。 


11.5 ”本 章 小 结 


在 本 章 中 ， 我们 介绍 了 从 本 地 和 远程 文档 中 搜索 和 收集 数据 的 计算 机 应 序 的 开发 过 
程 。 我 们 特别 重点 讨论 了 访问 、 搜 索 和 收集 万 维 网 上 的 数据 。 

万 维 网 无 疑 是 今天 在 互联 网 上 运行 的 最 重要 的 应 用 之 一 。 在 过 去 的 二 十 年 里 ， 网 络 彻底 
改变 了 我 们 工作 、 购 物 、 社 交 和 娱乐 的 方式 。 它 使 得 一 个 前 所 未 有 的 规模 的 信息 交流 和 分 享 
成 为 可 能 ， 并 且 已 经 成 为 一 个 巨大 的 数据 存储 库 。 这 些 数据 反 过 来 又 为 开发 收集 和 处 理 数 据 
并 产生 有 价值 信息 的 新 计算 机 应 用 提供 了 机 会 。 本 章 介 绍 了 Web 技术 、Python 标准 库 Web 
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API 以 及 用 于 开发 此 类 应 用 程序 的 算法 。 
我 们 介绍 了 关键 Web 技术 : URL、HTTP、HTML 等 。 我 们 还 介绍 了 用 于 访问 Web 资 
源 (模块 urllib.request) 和 处 理 网 页 (模块 html.parser) 的 Python 标准 库 API。 
我 们 已 经 了 解 了 如 何 使 用 这 两 个 API 下 载 一 个 网 页 HTML 源 文件 并 解析 它 以 获取 网 页 内 容 。 
为 了 处 理 网 页 或 任何 其 他 文本 文档 的 内 容 ， 需 要 某 种 工具 来 识别 文本 中 的 字符 串 模 式 。 
本 和 草 介 绍 了 这 样 的 工具 : 正则 表达 式 和 标准 库 模 块 re。 


11.6 练习 题 答案 
11.1 一 旦 下 载 HTML 文档 并 解码 到 一 个 字符 串 之 后 ， 就 可 以 使 用 字符 串 方法 处 理 : 


def news(url, topics).: 
‘''counts in resource with URL url the frequency 
of each OPC LE L183t TopicCS 
# 下 载 并 解码 资源 以 获取 所 有 的 小 写 内 容 
response = urlopen(ur]l) 
html = response.read() 
content = html.decode() .1ower() 


for topic in topics: # 查找 内 容 中 的 各 主题 频率 
n = Content .count (topic) 
print('{} appears {} times.'.format(topic, n)) 
11.2 方法 handle starttag() 和 handle endtag() 需要 重 载 。 这 两 个 方法 都 应 该 输出 对 应 的 
标记 ， 并 适当 缩 进 。 
缩 进 是 一 个 整 型 值 。 对 于 每 一 个 开始 标记 符号 ， 缩 进 值 递增 ; 而 对 于 每 一 个 结束 标记 符号 ， 
缩 进 值 递减 (我 们 忽略 元 素 p 和 br )。 缩 进 值 应 作为 解析 絮 对 象 的 实例 变量 存储 ， 并 在 构造 也 
数 中 初始 化 。 


模块 : ch11.py 


from html .parser import HTMLParser 
class MyHTMLParser (HTMLParser): 
' 基于 深度 缩 进 打印 标记 的 HTML 文档 解析 器 ， 


def _ init__(self): 


' 初始 化 解析 器 和 缩 进 值 ， 
， HTIMLParser.__init__(self) 
8 self.indent = 0 # 初始 化 缩 进 值 


10 def handle_starttag(self, tag, attrs): 

1 '''， 采用 缩 进 正比 于 文档 中 标记 元 素 

12 深度 的 方式 打印 开始 标记 ，'' 

13 i Cap not ln fbr", pp'}: 

print('{}{} start'.format(self.indent*' ', tag)) 
self.indent += 4 


def handle_endtag(self, tag): 

1 '' ' 采用 缩 进 正比 于 文档 中 标记 元 素 

深度 的 方式 打印 结束 标记 ，， 

20 1 

self.indent -= 4 

print('{}{} end'.format (self.indent*' ', tag)) 
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11.3 在 Collector 的 构造 消 数 中 应 该 初始 化 一 个 空 字符 串 实 例 变量 self .text。 处 理 滑 数 
handle data( ) 将 处 理 文本 数据 符号 ， 把 文本 数据 拼接 到 self .text。 代 码 如 下 所 示 : 
1 def handle_data(self, data): 
2 ' 收集 并 且 拼 接 文本 数据 ， 
self.text += data 


def getData(self) : 
' 返回 所 有 文本 数据 的 拼接 结果 ， 
return self.text 
11.4 答案 如 下 : 
(a) Hello, hello 
(b) 're-sign', 'resign' 
(c) aaa, best 
(d) F16, IBM 


(e) <hl>, <<>>>> 
11.5 答案 如 下 : 
(a) a[abc]c 
(b) abclxyz 
(ey afbT* 
(d) [a-z]+ 
(e) [a-zA-Z]*oe[a-zA-Z]* 


(9 
11.6 我 们 已 经 在 第 6 章 讨论 过 这 个 问题 。 这 里 的 解决 方案 是 使 用 正则 表达 式 来 匹配 单词 ， 相 对 于 原 
始 解决 方案 更 加 简洁 。 


def frequency(content): 
'''， 返回 一 个 字典 ,统计 在 字符 串 
内 容 中 的 单词 的 出 现 频率 ，'' 
pattern = '[a-zA-Z]j+' 
words = findall(pattern, content) 
dictionary = {} 
for w in words: 
it w In dictionary: 
dictionary[wj +=1 
else: 
dictionary[w] = 1 
return dictionary 


11.7 “ 习 十 
11.7 对 于 以 下 示例 ， 选 择 与 给 定 正 则 表达 式 相 匹配 的 字符 串 。 
正则 表达 式 字符 串 
(a) [ab] ab 、a、b、 空 字符 串 
(b) a.b. ab 、acb 、acbc、acbd 
(c) a?b? ab、a、b 、 空 字符 串 
(d) a*b+a* aa、b、aabaa、aaaab、ba 


(e) [Ad]+ ac 123、 2 3M 


了 30 锚 11 缆 


11;8 


ll1.9 


11.10 


11.11 


Ll 


El 


11.14 


对 于 下 列 每 一 个 非 正式 的 模式 描述 或 者 一 组 字符 串 ， 定 义 一 个 正则 表达 式 ， 以 符合 每 个 模式 的 
描述 或 者 仅仅 匹配 这 一 组 字符 串 。 

(a) 包含 一 个 捕 号 (”) 的 字符 串 

(b) 字母 表 中 任意 三 个 小 写字 母 组 成 的 序列 

(c) 一 个 正 整 数 的 字符 串 表 示 

(d) 一 个 非 负 整数 的 字符 串 表示 

一 个 负 整 数 的 字符 串 表 示 

(f) 一 个 整数 (无 论 正 负 ) 的 字符 串 表 示 

(g) 使 用 小 数 点 表示 法 的 浮 点 值 的 字符 串 表示 法 

对 于 下 列 非 正式 描述 ， 编 写 一 个 正则 表达 式 匹 配 文件 frankenstein.txt 中 与 如 下 描述 相 匹 
配 的 所 有 字符 串 。 同 时 使 用 模块 re 中 的 findall( ) 检查 结果 。 

(a) 字符 串 “Frankenstein 

(b) 文本 中 出 现 的 数值 

(c) 以 子 字 符 串 “ible ”结尾 的 单词 

(d) 以 大 写字 母 开 始 并 且 以 “y ”结束 的 单词 

(e) 格式 为 “horror of < 小 写字 符 串 > < 小写 字符 串 > ”的 字符 串 列表 

(f) 包含 一 个 单词 后 跟 单 词 “ death ”的 表达 式 

(g) 包含 单词 “1Laboratory ”的 句子 

编写 一 个 正则 表达 式 ， 匹 配 一 个 HTML 源 文 件 中 的 属性 href 及 其 值 (在 HTML 开始 标 
记 中 )。 

编写 一 个 正则 表达 式 ， 匹 配 以 美元 表示 的 单价 字符 串 。 例 如 ， 正 则 表达 式 应 该 匹配 类 似 
于 '$13.29' 和 '$1 099.29' 的 字符 串 。 正 则 表达 式 无 须 匹 配 大 于 $9 999.99 的 单价 。 
编写 一 个 正则 表达 式 ， 匹 配 表示 一 个 给 定格 式 DD/MM/YYYY 日 期 的 字符 串 (其 中 ，DD 是 两 
位 数字 月 份 中 的 日 ; MM 是 两 位 数字 月 份 ; YYYY 是 四 位 年 )。 

编写 一 个 正则 表达 式 ， 匹 配 一 个 电子 邮件 地 址 。 这 并 不 容易 ， 所 以 你 的 目标 应 该 是 创建 一 个 与 
你 的 电子 邮箱 地 址 尽 可 能 接近 的 正则 表达 式 。 

编写 一 个 正则 表达 式 ， 匹 配 使 用 HTTP 协议 的 绝对 URL 地 址 。 同 样 ， 这 也 是 一 个 棘手 的 问题 ， 
你 应 该 争取 编写 “最 好 ”的 正则 表达 式 。 


11.8 ”思考 题 


Dt 


lui6 


在 这 本 书 中 ,我 们 已 经 看 到 从 罕 符 串 中 删除 标点 符号 的 三 种 方式 : 使 用 第 4 童 的 字符 er 
replace() 和 字符 串 的 方法 translate()， 以 及 使 用 本 章 的 正则 表达 式 。 请 使 用 10.3 节 
实验 运行 时 间 分 析 框 架 比较 它们 的 运行 时 间 ，。 
HTML 文 持 编号 列表 和 项 目 列表 。 编 号 列表 是 使 用 元 素 o1 来 定义 的 ， 列 表 中 的 每 一 项 都 是 用 
元 素 1i 定义 的 。 项 目 列表 是 使 用 元 素 ul 定义 的 ， 列 表 中 的 每 一 项 都 是 使 用 元 素 1i 定义 的 
例如 ， 在 文件 w3c .html 中 ,项 目 列表 使 用 下 列 HTML 代码 描述 : 
<ul> 

<li>Web for All</1i> 


<li>Web on Everything</1i> 
</ul> 


开发 类 RN 作为 HTMLParser 的 一 个 子 类 ， 当 传递 一 个 HTML 文件 
时 ， 为 HTML 文档 中 的 每 一 个 编号 列表 或 者 项 目 列表 创建 一 个 Python 列表 。Python 列表 中 


和 
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的 每 一 项 都 应 该 是 出 现在 相应 HTML 列表 中 的 一 个 项 目 中 的 文本 数据 。 可 以 假设 HTML 文 
档 中 每 个 列表 的 每 个 项 目 只 包含 文本 数据 ( 即 没 有 其 他 HTML 元 素 )。 类 ListCcollector 
应 该 支持 方法 getlists()，, 不 市 任何 输入 参数 ， 返 回 一 个 包含 所 有 创建 的 Python 列表 的 
列表 。 


>>> infile = open('lists.html') 

>>> content = infile.read() 

>>> infile.close() 

>>> myparser = ListCollector() 

>>> myparser .feed(content) 

>>> myparser.getLists() 

[L'aAamn item', ‘Another', 'And another one'], 


[Te dne', TS two', "Item three', "1Item four"]] 


你 希望 创建 一 个 独特 的 恐怖 词典 ， 但 很 难 回 想 出 应 该 收录 到 字典 中 的 成 千 上 万 的 单词 。 一 个 绝 
妙 的 想法 是 实现 一 个 函数 scary( ) ， 读 取 一 本 慌 怖 小 说 (例如 ， 玛 丽 . 沃 斯 通 克 拉夫 特 * 雪 
业 ( Mary Wollstonecraft Shelley) 的 《科学 怪人 》) 的 电子 版 ， 使 用 正则 表达 式 抓 取 其 中 所 有 的 
单词 ， 按 词典 顺序 把 这 些 单词 写 人 一 个 名 为 dictionary .txt 的 新 文件 中 ， 同 时 输出 这 些 单 
词 。 你 的 函 数 应 该 市 一 个 输入 参数 : 文件 名 (例如 frankenstein.txt)。dictionary. 
txt 的 前 几 行 内 容 应 该 如 下 所 示 : 

a 

abandon 

abandoned 

abbey 

abhor 

abhorred 


abhorrence 
abhorrent 


编写 限 数 getContent ( ) ， 市 一 个 URL (字符 串 ) 作为 输入 参数 ， 仅 输出 与 网 页 关联 的 文本 
数据 内 容 ( 即 不 输出 标记 符号 )。 避 免 输出 跟 在 一 个 空 行 后 面 的 空 行 ， 并 删除 每 个 输出 行 中 的 多 


>>> getContent('http://www.nytimes.com/') 
The New York Times - Breaking News, World News &amp; Multimedia 
Subscribe to The Times 


Log In 
Register Now 


Home Page 


编写 限 数 emails()， 市 一 个 文档 (字符 串 ) 作为 输入 参数 ， 返 回 其 中 出 现 的 所 有 电子 邮件 地 
址 。 要 求 使 用 正则 表达 式 在 文档 中 查找 电子 邮件 地 址 。 


>>> from urllib.request import urlopen 

>>> url = 'http://www.cdm.depaul.edu' 

>>> content = urlopen(url) .read() .decode() 

>>> emails(content) 

{'advising@cdm.depaul.edu', 'wwwfeedback@cdm.depaul .edu', 


'admission@cdm.depaul .edu', 'webmaster@cdm.depaul .edu'} 
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开发 一 个 应 用 程序 ， 实 现 我 们 在 1.4 节 中 开发 的 Web 搜索 算法 。 你 的 应 用 程序 应 该 带 两 个 输入 
参数 : 一 个 网 页 地 址 的 列表 以 及 一 个 相同 大 小 的 目标 价格 的 列表 ， 要 求 程序 输出 对 应 产品 价格 
小 于 目标 价格 的 网 页 地 址 。 使 用 习题 11.11 的 解决 方案 在 HTML 源 文 件 中 找到 价格 。 

模块 ur11ib .request 中 另 一 个 有 用 的 函数 是 urzlLretrieve()。 它 市 两 个 输入 参数 : 一 个 
URL 地 址 以 及 一 个 文件 名 filename (都 作为 字符 串 )， 要 求 将 URL 标识 的 资源 的 内 容 复 制 到 
名 为 filename 的 文件 中 。 使 用 此 功能 开发 一 个 程序 ， 从 一 个 Web 站 点 复制 所 有 的 Web 页 面 
(从 主页 开始 ) 到 计算 机 上 的 本 地 文件 夹 中 。 
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本 章 将 介绍 几 种 用 于 操作 当今 计算 应 用 程序 中 所 创建 、 存 储 、 访 问 和 处 理 的 大 量 数据 的 
方法 

我 们 首先 介绍 关系 数据 库 和 用 于 访问 关系 数据 库 的 语言 ( SQL)。 与 我 们 在 本 书 中 开发 
的 许多 程序 不 同 ， 真 实 世 界 应 用 程序 通常 大 量 使 用 数据 库 来 存储 和 访问 数据 。 这 是 因为 数据 
库 以 某 种 方式 存储 数据 ， 从 而 方便 、 高 效 地 访问 数据 。 因 此 ， 及 早 认 知 数据 库 的 好 处 ， 以 及 
掌握 有 效 地 利用 数据 库 的 方法 是 十 分 重要 的 。 

通过 网 络 息 忠生 成 的 数据 、 科 学 实验 的 数据 或 者 股票 市 场 的 数据 是 如 此 巨大 ， 没有 一 个 
单一 的 计算 机 能 够 有 效 地 处 理 这 些 数据 。 蔡 代 地 ， 多 个 计算 节点 〈 不 管 是 计算 机 、 处 理 天 还 
是 处 理 需 内 核 ) 共同 工作 是 必需 的 。 我 们 介绍 了 一 种 开发 并 行程 序 的 方法 ， 它 能 有 效 地 利用 
现代 微 处 理 需 的 多 核 技术 。 然 后 ， 我 们 使 用 该 方法 来 开发 MapReduce 框架 。MapReduce 框 
架 是 由 谷歌 公司 开发 的 处 理 数 据 的 方法 ， 它 可 以 从 个 人 计算 机 上 的 几 个 内 核 扩展 到 服务 硕 集 
和 群 中 成 千 上 万 的 内 核 。 


12.1 数据 库 和 SQL 


程序 处 理 的 数据 仅 在 程序 执行 时 才 存 在 。 为 了 使 数据 在 程序 执行 后 继续 保留 ， 以 便 以 后 
可 以 由 其 他 程序 处 理 它 ， 数 据 必 须 存 储 在 文件 中 。 

到 目前 为 止 ， 我 们 一 直 在 使 用 标准 文本 文件 来 存储 数据 。 文 本 文件 的 优点 是 通用 、 吻 于 
处 理 。 其 缺点 是 没有 结构 ， 没 有 结构 就 无 法 有 效 地 访问 和 处 理 数 据 。 

在 本 市 中 ， 我们 将 介绍 一 种 特殊 类 型 的 文件 ， 称 为 数据 库 文件 (或 者 简称 为 数据 库 )， 
它 以 结构 化 的 方式 存储 数据 。 该 结构 使 数据 库 文 件 中 的 数据 能 够 进行 有 效 的 处 理 ， 包 括 高 效 
的 插入、 更新、 删除 ， 特 别 是 能 够 高 效 地 访问 。 在 许多 应 用 程序 中 ， 数 据 库 是 比 一 般 文 本 文 
件 更 为 合适 的 数据 存储 方法 ， 了 解 如 何 使 用 数据 库 是 非常 重要 的 。 


12.1.1 数据 库 表 


在 电子 案例 研究 CS.11 中 ， 我 们 开发 了 一 个 Web 疏 虫 程序 一 一 通过 网 页 中 的 超 链接 访 
问 网 页 的 程序 。 爬 虫 程序 扫描 每 个 访问 的 网 页 的 内 容 并 输出 有 关 它 的 信息 ， 包 括 网 页 中 包含 
的 所 有 超 链 接 URL 和 网 页 中 每 个 单词 的 出 现 频率 。 如 果 我 们 在 图 12-1 所 示 的 链接 Web 页 
面 上 运行 爬虫 程序 ， 每 个 网 页 包含 一 些 世 界 城 市 的 名 称 及 其 出 现 的 次 数 ， 超 链接 URL 将 以 
下 列 格式 输出 : 





URL Link 
one .html two.html 
one .html three.html 


two.html four.htm]l 


340 锚 12 莫 









.htm! five.html 


| 


three 
| Chicago x 3 






Nairobi > 


Beijing X60 | 人 Bogota x 2 


| Beijing Xx 3 | Chicago x3 
| Paris xX 5 | Paris x 2 


Chicago x 5 | Nairobi x | 

ome html four.htiml 
| Bogota x 3 i 
| Beijing x2 | 
| Paris x | 


two.html 
图 12-1 五 个 相互 链接 的 Web 页 面 。 每 个 网 页 都 有 一 些 世 界 主要 城市 的 出 现 次 数 。 例 如 ， 网 
页 one html 包 售 三 次 “Beijing 、 五 次 “Paris 、 五 次 “chicagc 。 它 还 
含 指 癌 Web 页 面 two .html 和 three .html 的 超 链 接 


例如 ， 前 两 行 显示 网 页 one .html 包含 指 问 网 页 two .html 和 three .html 的 超 链接 。 
疏 虫 程序 将 以 下 列 格式 输出 每 个 Web 页 面 中 每 个 单词 的 出 现 频率 : 


位 


URL Word Freq 
one.html Beijing 3 
one .html Paris 5 
one.html Chicago 5 

3 


two.html Bogota 


因此 ， 网 页 one. html 包 合 三 次 'Beijing' 、 五 次 ' Paris' 和 五 次 'Chicago'。 

假设 我 们 希望 分 析 扑 虫 程序 收集 的 数据 。 例 如 ， 我 们 可 能 希望 查询 下 列 信 息 : 

1. 单词 X 出 现在 哪个 网 页 ? 

2. 根据 网 页 中 出 现 的 单词 X 的 数量 排名 ， 包 含 单词 X 的 网 页 的 排名 是 什么 ? 

3. 包含 单词 X 的 网 页 有 多 少 个 ? 

4. 哪些 网 页 包含 指 回 网 页 Y 的 超 链接 ? 

5. 单词 'Paris' 在 所 有 的 网 页 上 出 现 的 次 数 是 多 少 ? 

6. 每 个 访问 过 的 网 页 有 多 少 个 导出 超 链接 ? 

7. 每 个 访问 过 的 网 页 有 多 少 个 导入 超 链接 ? 

8. 哪些 网 页 指 回 一 个 包含 单词 X 的 网 页 ? 

9. 包含 单词 X 的 网 页 中 ， 哪 个 网 页 有 最 多 的 导 人 超 链 接 ? 

在 爬虫 生成 的 数据 集 上 回答 这 些 问题 是 相当 及 烦 的 。 数 据 集 的 文本 文件 格式 要 求 将 文件 
谈 人 到 字符 串 中 ， 然 后 必须 使 用 特殊 字符 串 操作 来 检索 相关 数据 。 例 如 ， 为 了 回答 问题 1 ， 
我 们 必须 找到 包含 单词 X 的 文件 中 的 所 有 行 ， 将 每 一 行 拆 分 成 单词 ( 即 用 空格 分 隔 的 字符 
串 )， 收 集 每 行 中 的 第 一 个 单词 ， 然 后 删除 重复 的 URL 地 址 。 

另 一 种 方法 是 将 爬虫 程序 收集 的 信息 保存 到 数据 库 文 件 中 ， 而 不 是 一 般 用 途 的 文本 文件 
中 。 数 据 库 文件 以 结构 化 的 方式 存储 数据 ， 从 而 能 有 效 地 访问 和 处 理 数据 。 

结构 化 意味 着 数据 库 文 件 中 的 数据 存储 在 一 个 或 多 个 表 中 。 每 个 表 由 一 个 名 称 (如 客户 
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Customers 或 产品 Products) 标识 ， 每 个 表 由 列 和 行 组 成 。 每 个 列 都 有 一 个 名 称 ， 包 含 
特定 类 型 的 数据 : 字符 串 、 整 数 、 实 数 ( 浮 点 数 ) 每 。 表 的 每 一 行 包含 与 一 个 数据 库 记 录 相 
对 应 的 数据 。 

在 我 们 的 示例 中 ， 图 12-1 所 示 的 爬虫 程序 从 Web 页 面 上 抓 取 的 信息 可 以 存储 在 图 12-2 
所 示 的 两 个 数据 库 表 中 。 第 一 个 表 称 为 Hyperlinks， 包含 列 Url 和 Link。 表 中 的 每 一 
行 (记录 ) 包含 一 个 Url 列 中 的 字符 串 X 和 一 个 Link 列 中 的 字符 串 Y， 表 示 在 Web 页 面 
X 中 有 一 个 指 问 的 超 链接 。 第 二 个 表 称 为 KReywords， 包含 列 Url、Word 和 Freq。 每 
条 记录 分 别 包 含 列 Url 和 Word 的 字符 串 X 和 YY， 以 及 列 Fred 的 整数 Z， 对 应 于 单词 Y 
出 现在 URL 为 X 的 Web 页 面 中 ， 其 出 现 频率 为 Z。 

把 数据 存储 在 数据 库 表 中 后 ， 我 们 可 以 使 用 一 种 特殊 的 数据 库 编 程 语言 来 查询 数据 。 


Url Word Freq 
one .html Beijing 3 
one.html Paris 3 
one.html Chicago 3 
two.html Bogota 3 
Url Link two.html Beijing 2 
one .html two.html two.html Paris ] 
one .html three .html three.html Chicago 3 
two.html four.html three.html Beijing 6 
three.html four.html four.html Chicago 
four.html five.html four .html Paris 2 
five.html one.html four.html Nairobi 村 
five.html two.html five.html Nairobi 7 
five.html four.html five.html Bogota 2 
a) Table Hyperlinks b) Table Keywords 


图 12-2 ”数据库 表 Hyperlinks 和 Keywords。 这 两 个 表 包 含 息 虫 程序 在 图 12-1 所 示 的 页 面 
集 上 抓 起 处 理 后 的 数据 。Hyperlinks 的 行 对 应 于 网 页 Url 中 的 一 个 到 网 页 Link 
的 超 链 接 。Keywords 的 行 对 应 于 一 个 单词 出 现在 网 页 Url 中 ，Word 在 网 页 中 出 现 
的 频率 为 Freqg 


12.1.2 ”结构 化 查询 语言 


数据 库 文件 不 是 由 应 用 程序 通过 通 常 的 文件 输入 /输出 接口 来 读 取 或 写 人 人 的。 它们 通常 也 
不 能 直接 访问 。 相 反 ， 应 用 程序 通常 将 命令 发 送 到 一 种 特殊 类 型 的 服务 占 程 序 (被 称 为 数据 
库 引 获 或 数据 库 管理 系统 ， 用 于 管理 数据 库 )， 该 程序 将 以 应 用 程序 的 名 义 访问 数据 库 文件 。 

数据 库 引 擎 接受 的 命令 是 用 查询 语言 编写 的 语句 ， 其 中 最 流行 的 查询 语句 称 为 结构 化 查 
询 语言 (通常 被 称 为 SQL)。 接 下 来 ,我 们 将 介绍 一 个 SQL 的 小 子 集 。 当 数据 库 是 数据 存储 
的 正确 选择 时 ,我 们 可 以 使 用 SQL 来 编写 可 以 利用 数据 库 的 程序 。 


12.1.3 ”SELECT 语句 


SQL 的 SELECT 语句 用 于 查询 数据 库 。 在 其 最 简单 的 形式 中 ,该 语句 用 于 检索 数据 库 
表 的 列 。 例 如 ， 要 从 表 Hyperlinks 中 检索 列 Link， 其 SQL 语句 如 下 : 


SELECT Link FROM Hyperlinks 
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上 述 语 句 的 执行 结果 将 存储 在 一 个 结果 表 (又 称 之 为 一 个 结果 集 )， 如 图 12-3a 所 示 。 

我 们 使 用 大 写字 符 来 突出 显示 SQL 语句 中 的 关键 字 。 其 实 SQL 语句 是 不 区 分 大 小 与 
的 ， 所 以 我 们 也 可 以 使 用 小 写字 符 。 通 常 ，SQL 的 SELECT 语句 从 表 中 检索 列 的 子 集 ， 其 
语法 格式 如 下 : 

SELECT Column(s) FROM TableName 

例如 ， 要 选取 表 Keywords 的 列 Url 和 Word， 可 以 使 用 下 列 SQL 语句 : 

SELECT Url, Word FROM Keywords 
获得 的 结果 表 如 图 12-3b 所 示 。 要 抽取 表 Keywords 的 所 有 列 ， 可 以 使 用 通配符 *: 

SELECT * FROM Hyperlinks 
结果 表 从 图 12-2a 所 示 的 原始 表 Hyperlinks 中 获取 数据 。 

当 执 行 下 列 查询 时 : 

SELECT Link FROM Hyperlinks 
我 们 所 获得 的 结果 集 包 含 同一 个 链接 的 多 个 副本 。 如 果 需 要 抽取 列 Link 中 的 不 重复 链接 ， 
则 可 以 使 用 SQL 的 DISTINCT 关键 字 : 


SELECT DISTINCT Link FROM Hyperlinks 


其 结果 表 如 图 12-3c 所 示 。 


Url Word 
one.html Beijing 
one .html Paris 
one.html Chicago 
two.html Bogota 
Link two.html Beijing 
two.html two.html Paris 
three.html three.html Chicago 
four.html three.html Beijing Link 
four.html four.html Chicago two.html 
five.html four.html Paris three.html 
one.html four.html Nairobi four.html 
two.html five.html Nairobi five.html 
four.html five.html Bogota one.html 
SELECT Link SELECT Url, Word SELECT DISTINCT Link 
FROM Hyperlinks FROM Keywords FROM Hyperlinks 
a) b) c) 


图 12-3 三 个 查询 的 结果 表 。 每 个 表 都 是 其 下 面 查 询 语句 的 结果 。a 包含 表 Hyperlinks 
中 的 所 有 Link 值 b 包 含 表 Keywords 中 的 所 有 Url 和 Word 值 , c 包 含 表 
Hyperlinks 中 的 所 有 不 重复 的 Link 值 


知识 拓展 : 开始 学 习 SQL 语言 
在 下 一 节 中 ， 我们 将 介绍 Python 标准 库 模块 sqlite3。 它 提供 了 一 个 应 用 程序 编程 
接口 (API), 使 Python 程序 能 够 访问 数据 库 文件 并 在 其 上 执行 SQL 命令 。 
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如 果 你 迫不及待 想 尝 试 运行 我 们 刚才 描述 的 SQL 查询 ， 你 可 以 使 用 SQLite 命令 行 。 
它 是 一 个 独立 的 程序 ， 允 许 交互 式 地 对 数据 库 文件 执行 SQL 语句 。 不 过 ， 首 先 需 要 从 下 
列 网 址 下 载 预 编译 的 二 进 制程 序 : 


www.sqlite.org/download.html 


将 二 进 制 可 执行 文件 保存 在 包含 要 使 用 的 数据 库 文件 的 那个 目录 中 。 接 下 来 我 们 基于 
数据 库 文 件 Links.db(〈 图 12-2 显示 了 其 中 包含 的 两 张 表 )， 说 明 SQLite 命令 行 的 使 用 
方法 ， 所 以 我 们 把 可 执行 文件 保存 在 包含 该 文件 的 目录 中 。 

为 了 运行 SQLite 命令 行 ， 首先 需要 打开 系统 中 的 命令 行程 序 。 然 后 切换 到 包含 
sqlite3 可 执行 文件 的 目录 ， 并 运行 下 列 代码 以 访 间 数据 库 文件 Links .db: 

> ./sqlite3 links.db 

SOLite version 3,7.7,1 

Enter ".help" for instructions 

Enter SQL statements terminated with a ";" 

sqlite> 

(此 代码 适用 于 Unix/Linux/Mac OS X 系统 ; 在 MS Windows 系统 中 ， 应 该 使 用 命令 
sqlite3.exe links.db,) 

在 SQLite > 提示 符 下 ， 接 下 来 可 以 针对 数据 库 文件 1inks .db 执行 SQL 语句 。 唯 
一 的 附加 要 求 是 SQL 语句 必须 紧 跟 一 个 分 号 (;)。 例 如 : 

sqlite> SELECT Url, Word FROM Keywords ; 

one.html |Beijing 

one.html|Paris 

one.html|Chicago 


two.htm] |Bogota 
two.html |Beijing 


five.html |Nairobi 
five.html|Bogota 
sqlite> 


(省 略 了 几 行 输出 。) 你 可 以 使 用 SQLite 命令 行 执行 本 节 描 述 的 每 一 个 SQL 语句 。 


12.1.4 WHERE 子 句 


为 了 回答 类 似 如 “单词 X 出 现在 哪 一 页 ?” 的 问题 ， 我 们 需要 执行 一 个 数据 库 查 询 ， 只 
选择 表 中 的 一 些 记 录 ( 即 那些 满足 某 个 条 件 的 记录 )。SQL WHERE 子 句 可 以 添加 到 SELECT 
语句 中 ， 用 于 按 条 件 选择 记录 。 例 如 ， 要 选择 包含 “Paris” 的 Web 页 面 的 URL， 可 以 使 
用 下 列 SQL 语句 : 


SELECT Url] FROM Keywords 
WHERE Word = 'Paris: 


返回 的 结果 集 如 图 12-4a 所 示 。 注 意 ，SQL 中 的 字符 串 值 同样 适用 引号 作为 分 隔 符 (和 
Python 一 样 )。 一 般 地 ， 带 WHERE 子 句 的 SELECT 语句 的 语法 格式 如 下 : 


SELECT column(s) FROM table 
WHERE column operator value 


条 件 column operator value 限制 SELECT 语句 仅仅 应 用 于 满足 该 条 件 的 行 。 条 
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件 中 允许 的 运算 符 如 表 12-1 所 示 。 条 件 可 以 包含 在 括号 中 ， 可 以 使 用 人 逻辑 运算 符 AND 和 
OR 结合 两 个 或 者 多 个 条 件 。 注 意 : 使 用 BETWEEN 运算 符 时 ，WHERE 子 句 稍微 有 些 不 同 ， 
其 语法 格式 如 下 : 


WHERE column BETWEEN valuel AND value2 


Url Url Freq 
one.html one.html 3 
two.html four .html 2 
four .html] two.html ] 
SELECT Ur] FROM Keywords SELECT Url, Freq FROM Keywords 
WHERE Word = "Paris WHERE Word = 'Paris,' 


ORDER BY Freq DESC 
) b) 
图 12-4 两 个 查询 的 结果 表 。a 显示 了 在 表 Keywords 中 包含 单词 “Paris” 的 页 面 的 超 链接 。 
b 根据 单词 的 出 现 频率 按 降序 显示 包含 单词 “Paris” 的 网 页 排名 


假设 我 们 希望 图 12-4a 中 的 结果 集 按 单词 “Paris” 在 Web 网 页 中 的 出 现 频率 排序 。 
换言之 ， 假 设 问 题 是 :“ 根 据 网 页 中 字符 串 X 出现 的 次 数 ， 包 含 单词 X 的 网 页 的 排名 是 什 
么 ?” 要 在 结果 集中 按 特定 列 的 值 排序 ， 可 以 使 用 关键 字 ORDER BY: 

SELECT Url ,Freq FROM Keywords 

WHERE Word='Paris' 

ORDER BY Freq DESC 

上 述 语 句 返回 如 图 12-4b 所 示 的 结果 集 。 关 键 字 ORDER BY 后跟 一 个 列 名 ; 选择 的 记 
录 将 根据 该 列 中 的 值 排序 。 默 认 情 况 下 是 升序 。 在 上 述 语 名 中， 我 们 用 关键 字 DESC (表示 
“降序 ”) 获得 一 个 排序 ， 将 出 现 “Paris” 最 多 次 数 的 网 页 排 在 最 前 面 。 

表 12-1 SQL 条 件 运算 符 。 条 件 可 以 包含 在 括号 中 ， 可 以 使 用 逻辑 运算 符 AND 和 OR 结合 

两 个 或 者 多 个 条 件 
运 算 符 用 法 

于 


已 





<= 小 于 或 等 于 column <= value 
BETWEEN 在 包容 性 范围 内 column BETWEEN valuel and value2 


编写 返回 下 列 结 果 的 SQL 查询 语句 : 

(a) 包含 指向 Web 页 面 four .html 的 所 有 网 页 的 URL。 

(b) 包含 从 网 页 four .html 导入 链接 的 所 有 网 页 的 URL。 

(c) 单词 在 网 页 中 出 现 正好 三 次 的 网 页 的 URL 和 单词 。 

(d) 单词 在 与 URL 相关 联 的 网 页 中 出 现 正好 三 次 到 五 次 的 网 页 的 URL、 单 词 和 出 现 频率 。 
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12.1.5 ”内置 SQL 函数 

要 回答 类 似 “ 包 含 单 词 Paris 的 网 页 有 和 多少?” 的 问题 ,我们 需要 一 种 方法 来 计算 通过 查 
询 获 得 的 记录 数 。SQL 为 此 提供 了 一 个 内 置 隐 数 。 当 应 用 SQL 也 数 count ( ) 到 一 个 结果 
表 时 ， 返回 结果 表 的 行 数 : 


SELECT COUNT(*) FROM Keywords 
WHERE Word = 'Paris' 


得 到 的 结果 表 如 图 12-5a 所 示 ， 结 果 表 只 包含 一 列 和 一 条 记录 。 注 意 ， 该 列 不 再 对 应 于 我 们 
查询 的 表 的 某 个 列 。 

要 回答 “单词 Paris 在 所 有 网 页 上 出 现 的 总 次 数 是 多 少 ?” 的 问题 ， 我 们 需要 累加 表 
Keywords 中 在 Word 列 包 含 “Paris” 的 所 有 行 的 列 Freg 的 值 。SQL 困 数 sum( ) 可 以 
用 于 这 种 情况 ， 如 下 所 示 : 


SELECT SUM(Freq) FROM Keywords 
WHERE Word = 'Paris' 


结果 表 如 图 12-5b 所 示 。 


Url 

one.html 2 

two.html ] 

three.html | 

four.html ] 
3 8 five.html 


SELECT COUNT(*) SELECT SUM(Freq) SELECT Url, COUNT(*) 
FROM Keywords FROM Keywords FROM Hyperlinks 
WHERE Word = 'Paris' WHERE Word = "Paris' GROUP BY Url 


a) b) &) 
图 12-5 三 个 查询 的 结果 表 。a 包含 出 现 单词 “Paris” 的 网 页 数量 。b 包含 数据 库 中 所 有 网 页 
中 单词 “Paris” 出 现 的 总 次 数 。c 包含 每 个 网 页 导出 链接 的 超 链接 数量 


12.1.6 GROUP BY 子 句 

假设 接 下 来 想 知道 “每 个 Web 页 面 有 多 少 导出 链接 ?” 的 问题 。 要 回答 这 个 问题 ， 需 要 累 
加 每 个 不 同 URL 值 的 链接 数量 。SQL 子 句 GROUP BY 将 一 个 表 的 记录 按 指 定 列 中 相同 值 进行 
分 组 。 下 一 个 查询 将 通过 URL 值 将 表 Hyperlinks 中 的 行 分 组 ， 然 后 计算 每 组 中 的 行 数 : 


SELECT COUNT(*) FROM Hyperlinks 
GROUP BY Url 


稍微 修改 上 述 查 询 ， 同 样 包含 网 页 URL: 


SELECT Url, COUNT(*) FROM Hyperlinks 
GROUP BY UTr1] 


上 述 查 询 的 结果 如 图 12-5c 所 示 。 


i 对 于 下 列 问 题 ， 请 编写 一 个 SQL 查询 来 回答 : 
(a) 网 页 two.html 包含 多 少 个 单词 (包含 重复 单词 ) ? 
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(b) 网 页 two .html 包含 多 少 个 不 重复 单词 ? 

(c) 每 个 网 页 分 别 包 含 多 少 个 单词 (包含 重复 单词 )? 
(d) 每 个 网 页 分 别 包 含 多 少 个 导入 超 链 接 ? 

要 求 问 题 (c) 和 (d) 的 结果 表 和 包含 网 页 的 URL。 


12.1.7 多 表 SQL 查询 


假设 我 们 想 知 道 “什么 网 页 有 一 个 指 问 包含 单词 Bogota 的 网 页 的 超 链 接 ?” 的 问题 。 这 
个 问题 需要 查找 两 个 表 : Keywords 和 Hyper1lLinks。 我 们 需要 在 Keywords 中 查找 包含 
单词 “ Bogota” 的 网 页 的 URL 的 结果 集 S， 然 后 在 Keywords 中 查找 包含 指向 S 中 网 页 的 
超 链接 的 网 页 的 URL。 

SELECT 语句 可 以 在 多 个 表 上 使 用 。 为 了 理解 在 多 个 表 上 使 用 SELECT 时 的 行为 ， 我 们 
开发 了 几 个 示例 。 第 一 个 示例 如 下 : 

SELECT * FROM Hyperlinks, Keywords 

上 述 查 询 返 回 一 个 包含 104 条 记录 的 表 ， 每 个 记录 包含 Hyperlinks 中 的 记录 和 
Keywords 中 的 记录 的 组 合 。 结 果 表 如 图 12-6 所 示 ， 称 之 为 交叉 连接 ， 它 有 五 个 命名 列 ， 
对 应 于 表 Hyper1links 的 两 个 列 和 表 Keywords 的 三 个 列 。 


Hyperlinks Keywords 
Url Link Url Word Freq 
one .html two.html one.html Beijing 3 
one .html] two.html one .html Paris 3 
one .html two.html one .html Chicago 3 
one .html two.html two.html Bogota 3 
five.html four.html four.html Nairobi 3 
five.html four.html five.html Nairobi y 
five.htm]l four.html five.html Bogota 2 


SELECT * FROM Hyperlinks, Keywords 
图 12-6 连接 数据 库 表 。 该 表 由 表 Hyperlinks 的 每 一 行 和 表 Keywords 的 每 一 行 组 合 而 
成 。 由 于 表 Hyperlinks 有 8 行 ， 表 Keywords 中 有 13 行 ， 交 叉 连 接 将 有 8x 13 = 
104 行 。 图 中 只 显示 前 3 行 和 后 3 行 


当然 ， 在 交叉 连接 中 有 条 件 地 选择 一 些 记录 是 可 能 的 。 例 如 ， 下 一 个 查询 从 104 行 交 叉 连 接 
中 ， 选 择 表 Keywords 中 列 Word 包含 “Bogota” 的 16 行 记录 (图 12-6 中 显示 了 其 中 的 两 行 ): 


SELECT * FROM Hyperlinks, Keywords 
WHERE Keywords .Word = 'Bogota' 


注意 最 后 一 个 SQL 查询 的 语法 。 在 多 个 表 中 的 列 的 查询 中 ， 必 须 在 列 名 之 前 添加 
表 名 和 一 个 英文 句点 。 如 果 不 同 表 中 的 列 具 有 相同 的 名 称 ， 这 可 以 避免 混 消 。 要 指 回 表 
Keywords 的 列 Word， 必 须 使 用 符号 Keywords .Word。 

下 面 是 男 一 个 示例 。 下 一 个 查询 抽取 交 又 连接 中 Hyperlinks.Url 和 Keywords. 
Url 值 相 等 的 记录 : 
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SELECT * FROM Hyperlinks, Keywords 
WHERE Hyperlinks.Url1l = Keywords.Url 


上 述 查 询 的 结果 如 图 12-7 所 示 。 


Hyperlinks Keywords 
Url Link Url Word Freq 
one .html two.html two.html Bogota » 
one.html two.html two.html Beijing 2 
one.html two.html two.html Paris ] 
one .html] three .html three.html Chicago 3 
five.hbhtm]l four.html four .htmJ] Paris 2 
five.html four.html four.html Nairobi . 


SELECT * FROM Hyperlinks, Keywords 
WHERE Hyperlinks.Url = Keywords.Url 


图 12-7 ”连接 数据 库 表 。 其 中 包含 了 图 12-6 中 满足 条 件 Hyperlinks .Link = Keywords .Url 的 行 


概念 上 ， 图 12-7 中 的 表 包 含 这 样 的 记录 : 超 链接 指 癌 的 网 页 中 出 现 的 单词 ( 即 URL 
Hyperlinks .Link 的 网 页 ) 与 男 一 个 超 链 接 (从 Hyperlinks.Url 到 Hyperlinks. 
Link) 之 则 的 联系 。 

现在 ， 回 到 我 们 最 初 的 问题 :“ 什 么 网 页 有 一 个 指 回 包含 单词 Bogota 的 网 页 的 超 链接 ?” 
要 回答 这 个 问题 ， 我 们 需要 在 交 义 连接 中 选择 记录 ， 满 足 如 下 条 件 : Keywords .Word 的 
值 等 于 “Bogota ' ， 并 且 Keywords .Url 的 值 等 于 Hyperlinks .Link 的 值 。 图 12-8 显 
不 了 这 些 亿 录 s 


Hyperlinks Keywords 
Url Link Url Word Freq 
one.html two.html two.html Bogota 3 
four.html five.html five.htm] Bogota 2 
five.html two.html two.html Bogota 3 


SELECT * FROM Hyperlinks, Keywords 
WHERE Keywords .Word = 'Bogota' AND Hyperlinks.Link = Keywords.Url 


图 12-8 ”连接 数据 库 表 。 该 表 包 含 图 12-7 中 满足 条 件 Keywords .Word = 'Bogota' 的 记录 


要 查询 一 个 指 问 包含 'Bogota' 的 网 页 的 所 有 网 页 的 URL， 我 们 需要 执行 如 图 12-9 所 示 
的 查询 。 


Hyperlinks 
Un 
one.html 
four.html 
fijve.html 


SELECT Hyperlinks.Ur] FROM Hyperlinks, Keywords 
WHERE Keywords.Word = 'Bogota' AND Hyperlinks.Link = Keywords.Url 


图 12-9 连接 数据 库 表 。 结 果 表 仅 包含 图 12-8 中 所 示 表 的 列 Hyperlinks .Url 


12.1.8 CREATE TABLE 语句 
在 对 数据 库 进 行 查询 之 前 ， 我 们 需要 创建 表 并 将 记录 插入 其 中 。 当 创建 一 个 数据 库 文件 
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时 ， 它 将 是 空 的 ， 不 包含 任何 表 。SQL 语句 CREATE TABLE 用 于 创建 表 ， 其 语法 格式 如 下 : 


CREATE TABLE TableName 
( 
Columnl dataType, 
Column2 dataType, 


本 
我 们 将 语句 扩展 到 多 行 ， 并 缩 进 列 定 义 以 获得 更 好 的 视觉 殖 果 ， 这 并 没有 别 的 语法 意 
义 。 我 们 也 可 以 把 整个 语句 写成 一 行 。 
例如 ， 要 定义 表 Keywords， 可 以 执行 如 下 语句 : 


CREATE TABLE Keywords 
( 

Url text, 

Word text, 

Freq int 
) 


CREATE TABLE 创建 表 语 句 显 式 地 指定 表 的 每 个 列 的 名 称 和 数据 类 型 。 列 Url 和 
Word 是 text 文本 类 型 ， 它 对 应 于 Python str 数据 类 型 。 列 Freq 存储 整数 数据 的 频 座 。 
表 12-2 列 出 了 一 些 SQL 数据 类 型 和 相应 的 Python 数据 类 型 。 

表 12-2 SQL 数据 类 型 。 与 Python 整数 不 同 ，SQL 整数 大 小 有 限制 (-2” 到 2 -1 ) 


Sar 太 


INTEGER Int 存储 整 型 值 

REAL 存储 评点 人 

TEXT 存储 字符 串 值 ， 以 引号 分 隔 
BLOB 存储 字 节 系列 


12.1.9 INSERT 和 UPDRATE 语 铝 

SQL 语句 INSERT 用 于 插入 一 个 新 记录 ( 行 ) 到 数据 库 表 中 。 要 插入 一 个 完整 的 行 ， 包 
含 数 据 库 表 的 每 一 列 的 值 ， 请 使 用 下 列 语法 格式 : 

INSERT INTO TableName VALUES (valuel1l, value2, ...) 

例如 ， 要 插入 表 Keywords 的 第 一 行 ， 可 以 执行 如 下 语句 : 

INSERT INTO Keywords VALUES ('one.html', 'Beijing', 3) 

SQL 语句 UPDATE 用 于 修改 表 中 的 数据 。 其 一 般 语 法 格式 如 下 : 


UPDATE TableName SET column1l = valuel 
WHERE column2 = value2 


如 果 和 希望 更 新 网 页 page two.html 中 “Bogota” 的 频率 ， 可 以 使 用 下 列 方法 更 新 表 


Keywords : 





UPDATE Keywords SET Freq = 4 
WHERE Url = 'two.html' AND Word = :Bogota' 
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知识 拓展 : 更 多 关于 SQL 的 知识 

SQL 专门 用 来 访问 和 处 理 存 储 在 关系 数据 库 (也 就 是 说 ， 存 储 在 表 中 的 数据 项 的 集 
合 ， 可 以 以 各 种 方式 访问 和 处 理 ) 中 的 数据 ,“ 关 系 ” 这 个 术语 指 的 是 关系 的 数学 概念 ， 
它 是 一 组 项 ， 或 者 更 广泛 地 说 是 项 的 元 组 。 因 此 ， 一 个 表 可 以 看 作 是 一 个 数学 关系 。 

在 本 教程 中 ， 我们 一 直 在 以 特殊 的 方式 编写 SQL 语句 。 通 过 数学 的 视角 来 观察 表 的 
好 处 是 ， 抽 象 和 数学 的 力量 可 以 使 我 们 理解 使 用 SQL 计算 什么 和 如 何 计算 。 关 系 代 数 是 
数学 的 一 个 分 支 ， 它 是 为 这 一 目的 而 开发 的 。 

如 果 想 学 习 更 多 有 关 SQL 的 知识 ， 有 很 多 在 线 资源 ， 包 括 : 


WWW .Ww3schools.com/sql/default .asp 


12.2 Python 中 的 数据 库 编程 

掌握 了 基本 的 SQL 知识 ,我们 现在 可 以 编写 将 数据 存储 在 数据 库 中 和 执行 数据 库 查询 的 
应 用 程序 。 在 本 节 中 ， 我 们 将 展示 如 何 将 网 络 息 虫 抓 取 的 数据 存储 到 数据 库 中 ， 然 后 在 一 个 
简单 的 搜索 引擎 应 用 的 背景 下 挖掘 该 数据 库 。 我 们 首先 介绍 访问 数据 库 文件 的 数据 库 API。 


12.2.1 数据 库 引 警 和 SQLite 


Python 标准 库 包 含 一 个 数据 库 接口 模块 sqlite3， 为 Python 开发 人 员 提 供 了 一 个 简单 
的 内 置 的 访问 数据 库 文件 的 API。 与 典型 的 数据 库 API 不 同 ，sqlite3 模块 不 是 一 个 独立 
的 数据 库 引 擎 的 程序 接口 。 它 是 一 个 被 称 为 SoLite 的 图 数 库 的 接口 ， 用 于 直接 访问 数据 
库 文件 。 


知识 拓展 : SQLite 数据 库 与 其 他 数据 库 管 理 系统 

应 用 程序 通常 不 直接 读 取 或 写 入 数据 库 文件 。 相 反 ， 它 们 将 SQL 命令 发 送 到 数据 库 
引 获 (或 者 更 正式 的 名 称 ， 关 系数 据 库 管理 系统 (RDBMS))。RDBMS 管理 数据 库 ， 并 以 
应 用 程序 的 名 义 访问 数据 库 文件 。 

第 一 个 RDBMS 在 20 世纪 70 年 代 初 由 麻 省 理工 学 院 开 发 完成 。 当 今 社 会 使 用 的 主 
要 RDBMS 包括 IBM、Oracle、Sybase、 微 软 公 司 开发 的 商业 关系 数据 库 ， 以 及 开源 的 
RDBMS， 如 Ingres、Postgres 和 和 MySQL。 上 所 有 这 些 引擎 都 是 作为 独立 于 Python 之 外 的 
程序 来 运行 的 。 为 了 访问 它们 ， 你 必须 使 用 一 个 API( 即 Python 模块 )， 它 提供 了 人 允许 
Python 应 用 程序 向 引擎 发 送 SQL 语句 的 类 和 函数 。 

然而 ，SQLite 是 一 个 函数 库 ， 它 实现 了 一 个 SQL 数据 库 引 人 擎 ， 可 以 在 应 用 程序 上 
下 文 执行 ， 而 不 是 独立 运行 。SQLite 是 非常 轻 量 级 的 ， 被 许多 应 用 程序 (包括 Firefox 和 
Opera 浏览 器 、Skype、 蔷 果 的 1i0S 和 谷歌 的 Android 操作 系统 ) 广泛 用 于 在 本 地 存储 数 
据 。 因 此 ，SQLite 被 称 为 应 用 最 广泛 的 数据 库 引 擎 。 


12.2.2 ”使 用 sqlite3 创建 一 个 数据 库 
接 下 来 我 们 通过 回顾 扫描 网 页 ， 并 将 其 中 的 超 链接 URL 及 单词 出 现 的 频率 保存 到 数据 
库 所 需要 的 必要 步骤 ,来 展示 sqlite3 数据 库 API 的 使 用 方法 。 首 先 ， 我 们 需要 创建 一 个 
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与 数据 库 文 件 的 连接 ， 它 相当 于 打开 一 个 文本 文件 : 


>>> Import Sqlite3 
>>> con = sqlite3.connect('web.db') 


咕 数 connect ( ) 是 模块 a 中 的 一 个 函数 ， 带 一 个 输入 参数 : 一 个 数据 库 文件 
名 (位 于 当前 工作 目录 中 )， 返 回 一 个 类 型 Connection ep sqlite3 中 的 类 型 ) 
的 对 象 。Connection mie 在 上 述 语 句 中 ， 如 果 在 当前 工作 目录 中 存 
在 数据 库 文件 web .db， 则 connection 对 象 con 表示 该 数据 库 文件 ; 否则 ， 会 创建 一 个 
新 的 数据 库 文件 web .db。 

当 我 们 创建 了 一 个 与 数据 库 相 关联 的 连接 (Connection) 对 象 后 ， 我 们 需要 创建 一 个 
游标 对 象 ， 用 于 执行 SQL 语句 。Connection 的 类 方法 cursor() 返回 一 个 Cursor 类 
型 的 对 象 


>>> cur = con.cursor() 


Cursor 对 象 是 数据 库 处 理 的 主要 对 象 。 它 提供 了 一 个 方法 execute( ) ， 市 一 条 SQL 
语句 (作为 字符 串 ) 作为 参数 并 执行 该 语句 。 人 例如， 要 创建 数据 库 表 Keywords， 只 需要 把 
SQL 语句 作为 字符 串 参 数 传递 给 方法 execute( ) : 


>>> cur.execute("""CREATE TABLE Keywords (Url]l text, 
Word text, 
Freq int)""") 


创建 了 表 Keywords 之 后 ， 我 们 就 可 以 搬入 记录 了 。 只 需要 把 SQL 的 INSERT INTO 
语句 作为 输入 参数 传递 给 execute( ) 方法 : 

>>> cur.execute("""INSERT INTO Keywords 

YALURS Coune. htnl, "Doiging:,. 3) "wn) 

在 这 个 例子 中 ,插入 到 数据 库 中 的 值 ('one.html'、'Beijing' 和 3 ) 在 SQL 语句 
的 字符 串 表 达 式 中 是 “ 硬 编码 ”。 一 般 情 况 并 非 如 此 ， 因 为 通常 在 程序 中 执行 的 SQL 语句 使 
用 来 自 Python 变量 的 值 。 为 了 构造 使 用 Python 变量 值 的 SQL 语句 ， 我 们 使 用 类 似 于 字符 
串 格 式 化 的 技术 ， 称 之 为 参数 替换 。 

例如 ， 假 如 我 们 和 希望 插入 一 条 新 的 记录 到 数据 库 中 ， 新 记录 包含 值 : 

2 TEL Word, Yeg = one.html', Parigs's 二 

我 们 像 往常 一 样 构造 SQL 语句 字符 串 表 达 式 ， 但 是 将 一 个 “? ”符号 作为 占 位 符 ， 表 示 
Python 变量 值 所 处 的 位 置 。 这 对 应 于 execute( ) 方法 的 第 一 个 参数 。 第 二 个 参数 是 一 
包含 三 个 变量 的 元 组 : 


>>> cur.execute("""INSERT INTO Keywords 
ALUES 7, Fs PF CU Vord, Froq?3 


元 组 的 每 个 值 都 映射 到 一 个 占 位 符 ， 如 图 12-10 所 示 。 


' INSERT INIO Keywords VALUES (C7? 了? 了 yi { url Word ; freq )) 


图 12-10 ”参数 替换 。 在 SQL 字符 串 表 达 式 中 占 位 符 “? ”被 替换 为 对 应 的 变量 值 
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我 们 也 可 以 事先 把 所 有 的 值 组 合成 一 个 元 组 : 


>>> record = ('one.html','Chicago' , 5) 
>>> cur.execute("INSERT INTO Keywords VALUES (?, ?, ?)", record) 


注意 事项 : 安全 问题 一 一 SQL 注入 
可 以 使 用 格式 化 字符 串 和 字符 串 format() 方法 构造 SQL 语句 的 字符 串 表 达 式 。 然 
而 ， 这 是 不 安全 的 ， 因 为 它 易 受 被 称 为 “SQL 注入 攻击 ”的 安全 攻击 。 当 然 不 应 该 使 用 
格式 化 字符 串 来 构造 SQL 表达 式 。 


12.2.3 提交 数据 库 更 改 和 关闭 数据 库 


对 数据 库 文件 的 更 改 (包括 创建 表 、 删 除 表 、 插 入 行 、 更 新 行 ) 实际 上 不 会 立即 写 
和 数据库 文件 。 它 们 只 在 内 存 中 暂时 记录 下 来 。 为 了 保证 写 人 变更 内 容 ， 必 须 通 过 调用 
Connection 对 象 的 commit( ) 方法 来 提交 变更 内 容 。 

>>> con.commit() 

当 完 成 数据 库 文 件 工 作 时 ， 需 要 关闭 它 ， 就 像 关 闭 文 本 文件 一 样 。 可 以 通过 调用 
Connection 对 象 的 close( ) 方法 来 关闭 数据 库 文 件 : 


>>> Con.close() 


实现 函数 webData()， 带 下 列 输入 参数 : 

1. 数据 库 文件 名 称 ; 

2. 一 个 网 页 的 URL; 

3. 一 个 网 页 中 的 所 有 超 链 接 列表 ; 

4. 一 个 映射 网 页 中 每 个 单词 到 其 在 网 页 中 出 现 频率 的 字典 。 

要 求 数 据 库 文件 包含 如 图 12-2a 和 12-2b 所 示 的 表 Keywords 和 Hyper1lLinks。 要 求 
函数 为 列表 中 的 每 个 超 链 接 在 表 Hyper1lLinks 中 插入 一 行 记 录 ， 为 字典 中 的 每 个 (word， 
frequency) 对 在 Keywords 中 插入 一 行 记 录 。 执 行 完 这 些 操作 后 ， 应 该 提交 和 关闭 数据 库 。 


12.2.4 使 用 sqlite3 查询 数据 库 


接 下 来 我 们 将 展示 如 何 从 Python 程序 中 执行 SQL 查询 。 我 们 在 数据 库 文件 Links .db 
上 执行 查询 操作 ， 该 数据 库 文件 中 包含 如 图 12-2 所 示 的 表 Hyperlinks 和 Keywords。 


>>> import Sqlite3 
>>> con = sqlite3.connect('links.db') 
>>> cur = con.cursor() 


为 了 执行 一 条 SQL 的 SELECT 语句 ， 我 们 只 需要 把 该 语句 作为 一 个 字符 串 参 数 传递 给 
游标 的 execute( ) 方法 : 
>>> CUT .execute('SELECT * FROM Keywords') 


SELECT 应 该 返回 结果 表 。 那 么 ， 结 果 表 在 哪儿 呢 ? 
该 表 存 储 在 Cursor ens 如 果 想 要 访问 它 ， 可 以 使 用 下 列 几 种 方式 获取 它 。 
要 获取 选 定 的 记录 为 一 个 元 组 ， 可 以 使 用 (cursor 类 的 ) fetchall() 方法 : 


>>> cur.fetchall() 
[KGme ,RE "Boiijing!', SS), Cons. tnl’, "Paris, BD), 
("wne, htal', Cuicago's BD)s Ta ltnl's "Bogova's 3) 


(“five .html', ‘Bogota' , 2)] 


男 一 种 方法 是 将 Cursor 对 象 cur 直接 作为 一 个 迭代 此 ， 并 迭代 访问 : 


>>> cur.execute('SELECT * FROM Keywords') 
<sqlite3.Cursor object at 0x15f93b0> 
3 Lor racord in ur: 

print (record) 


("om .html "Baijing's 3) 
(one.html’, "Paris's 8) 


人 

第 二 种 方法 具有 内 存 高 效 的 优点 ， 因 为 不 用 在 内 存 中 存储 大 的 列表 。 

如 果 查 询 使 用 存储 在 Python 变量 中 的 值 该 怎么 办 ?假设 我 们 想 知 道 哪 些 网 页 包含 word 
的 值 ， 其 中 word 的 定义 如 下 : 

>>> word = :Paris， 

有 再次， 我们 可 以 使 用 参数 和 蔡 换 : 


>>> CUT .execute('SELECT Url FROM Keywords WHERE Word = ?', (word,)) 
<sqlite3.Cursor object at Ox15f9b30> 


word 的 值 蔡 换 了 SQL 查询 中 的 占 位 符 位 置 。 让 我 们 确认 该 查询 确实 查 出 了 包含 单词 
“Paris” 的 所 有 网 页 : 


>>> cur.fetchall() 
LUGme. Htmle, YY, Cy nl) (four hms )] 


让 我 们 尝试 一 个 使 用 两 个 Python 变量 值 的 示例 。 假 设 我 们 想 知 道 包 含 单 词 word 出 现 
频率 多 于 mn 次 的 网 页 URL， 其 中 : 


>>> Word, 1 = "Beijing's 2 
我 们 再 次 使 用 图 12-11 所 示 的 参数 替换 : 


>>> cur.execute("""SELECT * FROM Keywords 
WHERE Word = ? AND Freq > ?""", (word, n)) 
<sqlite3.Cursor object at 0x15f9b30> 


'SELECT * FROM Keywords WHERE Word = ? AND Freq > 了 '，(word , n )) 





Se 


图 12-11 两 个 参数 SQL 替换 。 第 一 个 参数 匹配 第 一 个 占 位 符 ， 第 二 个 参数 匹配 第 二 个 占 位 符 


注意 事项 : 两 个 游标 的 陷阱 
如 果 执 行 了 cur .execute() 语句 之 后 ， 运 行 下 列 命令 : 
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>>> cur.fetchall() 
[('one .html'，* Beijing'，3)，('thrzee .htnl'，'Beijing'，6)] 
将 得 到 预期 的 结果 表 。 然 而 ， 如 果 再 次 运行 cur .fetchal1( ): 
>>> cur.fetchall() 
[] 
结果 为 空 。 问 题 关键 在 于 : fetchall() 将 清空 Cursor 对 象 缓冲 区 。 如 果 通 过 迭 
代 Cursor 对 象 获取 结果 表 中 的 记录 ， 情 况 也 是 如 此 。 
如 果 没 有 获取 前 一 次 查询 的 结果 ， 执 行 SQL 查询 会 产生 另 一 个 问题 : 
>>> cur.execute("""SELECT Url FROM Keywords 
WHERE Word = 'Paris’'""") 
<sqlite3.Cursor object at 0xl5f9b30> 
>>> cur.execute(""'"SELECT Ur] FROM Keywords 
WHERE Word = 'Beijing'""") 
<sqlite3.Cursor object at Oxi5f9b30> 


>>> cur .fetchal1() 
(rona. htmls}, Ctwohtnl',), (6 .t+ 7 


fetchall() 返回 仅 第 二 次 查询 的 结果 。 第 一 次 查询 的 结果 被 丢失 。 


踊 天 后 可 PE 搜索 引擎 是 一 个 服务 应 用 程序 ， 从 用 户 处 获取 一 个 关键 字 ， 返 回 包含 该 
关键 宁 的 网 页 URL， 并 根据 某 个 特定 的 准则 对 网 页 排序 。 在 本 练习 题 中 ， 要 求 开 发 一 个 简 
单 的 搜索 引擎 ， 基 于 频率 对 网 页 进行 排序 。 

编写 一 个 搜索 引擎 应 用 程序 。 该 搜索 引擎 应 用 程序 基于 一 个 如 图 12-2b 所 示 的 数据 库 
表 Keywords ， 该 表 存 储 网 页 爬虫 结果 所 搜寻 到 的 单词 出 现 频率 。 搜 索引 擎 应 用 程序 将 提 
示 用 户 输入 一 个 关键 字 ， 然 后 简单 地 返回 包含 该 关键 字 的 网 页 ， 按 照 关键 字 的 出 现 频 率 降序 
排列 。 


>>> freqSearch('links.db') 
Enter keyword: Paris 


URL FREQ 
one .html 5 
four.html 2 
two .html 1 


Enter keyword: 


12.3 ”函数 语言 方法 

在 本 市 中 ， 我 们 将 展示 MapReduce (谷歌 公司 开发 的 数据 处 理 框 架 )。 其 主要 特点 是 它 
是 可 伸缩 的 ， 这 意味 着 它 能 够 处 理 非 常 大 的 数据 集 。 它 足够 健壮 ， 足 以 使 用 多 个 计算 节点 处 
理 大 数据 集 ， 计 算 节 点 可 以 是 一 个 微 处 理 器 中 的 内 核 ， 也 可 以 是 一 个 云 计 算 平 台中 的 计算 
机 。 事 实 上， 在 下 一 节 将 展示 如 何 扩展 我 们 开发 的 框架 以 利用 个 人 电脑 的 微 处 理 器 的 所 有 
内 核 。 

为 了 使 我 们 的 MapReduce 实现 尽 可 能 简单 ， 我 们 引入 了 一 个 新 的 Python 构造 : 列表 解 
析 。 列 表 解 析 和 MapReduce 框架 都 源 于 晒 数 式 编 程 语 言 范 式 ， 我 们 将 简单 地 进行 描述 。 
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12.3.1 列表 解析 


打开 一 个 文本 文件 后 ,使 用 方法 readlines ( ) 读 取 文 件 ， 将 获得 一 个 文本 行 的 列表 . 
列表 中 的 每 一 行 以 新 的 换行 符 \n 结尾 。 例 如 ， 假 设 获得 的 文本 行列 表 如 下 : 
>>> lines 
[First bive\n', 'Second\n', '\n', ‘and Fourth, Vn’] 
在 典型 应 用 中 ,字符 \n 会 妨碍 文本 行 的 处 理 ， 我 们 需要 删除 它 。 删 除 \n 的 一 种 方法 
是 使 用 for 循环 和 熟悉 的 累加 器 模式 : 


>>> newlines = [] 
>>> for i in range(len(lines)): 
newlines.append(lines[i][:-1]) 


在 for 循环 的 每 次 迭代 i 中 ， 删 除 第 i 行 的 最 后 一 个 字符 (换行 字符 \n) 并 把 修改 后 
的 文本 行 添 加 到 一 个 累加 天 列表 newlines 中 : 


>>> newlines 
['First Liie”" SC6nG1 '*', *and Fourtk, | 


Python 中 还 有 一 种 完成 同样 任务 的 方法 : 

>>> newlines = [line[:-1] for line in lines] 

>>> newlines 

['First Line', 'Second', '', "and Fourth.'] 

Python 语句“ [line[:-1] for line in lines]” 基 于 列表 lines 构造 一 个 新 
的 列表 ， 是 Python 的 列表 解析 构造 。 其 工作 原理 如 下 : 从 左 到 右 ， 针 对 lines 中 的 每 一 
个 项 应 用 line[ :-1] 来 生成 新 列表 。 新 列表 中 项 出 现 的 顺序 对 应 于 原始 列表 lines 中 对 
应 项 的 顺序 (参见 图 12-12 ) 。 


as We 


[:-1] 


lines: 











] at 
a 
[:-1] 


[Eee | | [ge | | (7) | | PR 






newlines: 
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图 12-12 列表 解析 。 从 一 个 既 存 列表 构造 一 个 新 的 列表 。 把 同一 个 孔 数 应 用 到 既 存 列表 中 的 
每 一 个 项 来 构造 新 的 列表 
更 一 般 地 ， 列 表 解 析 语 句 的 语法 格式 如 下 : 
[< 表达 式 > for < 项 > in < 序列 / 迭代 器 >] 
语句 的 计算 结果 为 一 个 列表 ， 通 过 把 < 表达 式 > (通常 与 < 项 > 相关 联 ) 应 用 到 可 迭代 
选 


容 希 < 序列 /迭代 需 > 的 每 个 项 生成 新 列表 的 项 。 一 个 更 一 般 的 版 本 格式 还 包括 一 个 可 选 的 
条 件 表达 式 : 


[< 表达 式 > for < 项 > in < 序列 /和 迭代 器 > if < 条 件 >] 
在 这 种 情况 下 ， 通 过 应 用 < 表达 式 > 到 < 序列 / 壕 代 帮 > 的 满足 < 条 件 > 的 项 来 生成 
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新 列表 的 项 。 
让 我 们 尝试 几 个 示例 。 对 上 一 个 示例 进行 如 下 更 改 ， 使 得 新 的 列表 将 不 包含 空 字符 串 
(对 应 于 原始 文件 的 空 行 ) 


>>> [line[:-1] for line in lines if line != '\n'] 
First Line', 'Second', ad Fourth. '] 


在 下 一 个 示例 ， 我 们 构造 一 个 不 超过 20 的 偶数 列表 : 


> [EE or 1 in range(0,. 20, 27] 
LS Te ks Wo 


在 下 一 个 示例 ,我 们 计算 一 个 列表 中 字符 串 的 长 度 : 


>>> [len(word) for word jin ['hawk', 'lien', 'hog', 'hyena']] 
[人 


假设 字符 串 列 表 words 定义 如 下 : 
>>> Words = ['hawk', 'hen', 'hog', 'hyena'] 


编写 列表 解析 语句 ， 使 用 words 作为 原始 列表 ， 构 造 如 下 列表 : 
(a) ['Hawk', 'Hen', 'Hog', 'Hyena'] 
(WW I havk’s 4 Chen", WD, 3), (byena!'s 5S}]| 
ey LL Ut nk a he .RI 
[em hen') ， (世相 下放 二 'hen')]， 浊 虹 3 ow ), | 
Cs mo 3}: i ‘hog")]; LCT 'hyena' ) ， 和 'hyena' ) ， 
eo", hyena Cy, "yine), (Ca, yon)j) 
我 们 对 (c) 中 的 列表 加 以 解释 。 对 于 原始 列表 中 的 每 个 字符 串 s， 创建 一 个 新 的 元 组 列 
表 ， 每 个 元 组 映射 字符 串 的 一 个 字母 到 字符 串 s 本 身 。 


知识 拓展 : 范 数 式 编程 

列表 解析 是 借用 自 函 数 式 编程 语言 的 编程 结构 。 列 表 解 析 起 源 于 编程 语言 SETL 和 
NPL， 当 它 被 包含 在 函数 式 编程 语言 Haskell 和 (特别 是 ) Python 后 ， 越 来 越 为 大 众 知晓 。 

函数 式 语言 范式 不 同 于 命令 式 、 陈 述 式 和 面向 对 象 的 范式 ， 因 为 它 没有 “语句 ”， 只 
有 表达 式 。 函 数 式 语言 程序 是 一 个 表达 式 ， 它 包含 一 个 函数 调用 ， 它 通过 数据 和 其 他 可 
能 的 函数 作为 参数 。 函 数 式 编程 语言 的 例子 包括 Lisp、Scheme、Clojure、ML、Erlang、 
Scala、F #， 和 Haskell。 

Python 不 是 一 种 函数 式 语言 ， 但 它 借用 了 一 些 有 助 于 创建 更 简洁 、 更 短小 的 Python 
程序 的 函数 语言 结构 。 


12.3.2 ”MapReduce 问题 求解 框架 

我 们 最 后 一 次 考虑 的 是 计算 字符 串 中 每 个 单词 的 出 现 频率 的 问题 。 我 们 使 用 这 个 例子 来 
引入 字典 容器 类 ， 并 开发 一 个 非常 简单 的 搜索 引擎 。 我 们 现在 基于 这 个 问题 来 创建 一 种 被 称 
为 MapReduce 的 新 方法 ，MapReduce 由 谷歌 公司 开发 用 于 解决 数据 处 理 问题 。 

假设 我 们 想 计算 列表 中 每 个 单词 的 出 现 频率 : 


了 30 锣 12 摹 


>3> WOrds = ['twvo', 1， threer 6 'three', 'thiree', 


'five', 'one', 'five'] 

使 用 MapReduce 方法 解决 该 问题 包括 三 个 步骤 : 

首先 ， 为 列表 words 中 的 每 个 word 创建 一 个 元 组 : (word， 1)。(word， 1) 对 被 
称 为 (key，value) 对 ， 每 个 键 word 的 值 1 捕获 一 个 单词 特定 实例 的 计数 。 注 意 ， 对 原始 
列表 words 中 出 现 的 每 个 word 都 有 一 个 (word，1) 对 。 

每 个 (key，value) 对 保存 在 自己 的 列表 中 ， 所 有 这 些 单 个 元 素 列 表 都 包含 在 列表 
intermediatel 中 ， 如 图 12-13 所 示 。 

MapReduce 的 中 间 步 又 是 把 所 有 包含 相同 word 的 [(word,1)] 列表 组 合 在 一 起 创 
建 一 个 新 的 (key，value) 对 (word，[1，1，…，1])， 其 中 [1，1，…，1] 是 所 有 值 1 
组 合 在 一 起 的 列表 。 注 意 ， 对 原始 列表 words 中 的 每 个 单词 word 在 [1，1，…，1] 中 
都 有 一 个 1。 我 们 把 中 间 步 骤 获 得 的 (key，value) 对 的 列表 称 为 intermediate2 (参见 
图 12-13 轧 

在 最 后 一 步 ，intermediate2 中 每 个 (word，[1,1,…,1]) 的 1 累加 起 来 ， 如 
图 12-13 所 示 。 我 们 把 最 后 的 (key，value) 对 列表 称 为 frequency, 
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图 12-13 MapReduce 用 于 单词 频率 。 使 用 列表 解析 把 列表 words 中 的 每 个 单词 映射 
到 [(word,1)]。 这 些 新 的 列表 被 存储 到 列表 intermediatel 中。 然后 
intermediatel 中 的 所 有 包含 相同 word 的 [ (word，,1)] 列表 组 合 在 一 起 创建 元 
组 (word，[1，1，…，1])。 在 最 后 一 步 ， 这 些 元 组 中 的 1 累加 到 变量 count， 
并 把 元 组 (word，count ) 添加 到 列表 frequency 中 


让 我 们 看 看 如 何在 Python 中 实现 这 些 步 又。 首先 基于 列表 words 通过 应 用 因数 
occurrence( ) 为 列表 words 中 的 每 个 单词 构建 一 个 新 的 列表 : 
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模块 : ch12.py 


def occurrence(CWord) : 
"Toturns list corntaining tuple (word, 1 
return [(word, 1)] 


使 用 列表 解析 ， 我 们 可 以 把 MapReduce 的 第 一 步 简洁 表述 如 下 : 


>>> intermediatel = [occurrence(word) for word in words] 
>>> intermediatel 


[EGG 17: LC'whses', 4 , tioas', 41], LOWwee', 1 
Lherese, yl, It'sive's £1] [riong. TH. [Cya:. T1711 
这 一 步 被 称 为 MapReduce 的 Map (映射 ) 步骤 ， 哨 数 occurrence( ) 被 称 为 词 频 问题 
的 Map 盯 数 。 


注意 事项 : Map 步骤 返回 一 个 元 组 的 列表 
函数 occurrence() 返回 一 个 只 包含 一 个 元 组 的 列表 。 你 可 能 会 疑惑 它 为 什么 不 返 
回 元 组 本 身 ? 
其 原因 是 我 们 的 目标 不 仅仅 是 解决 词 频 问题 。 我 们 的 目标 是 开发 一 个 通用 的 框架 ， 可 
以 用 来 解决 一 系列 问题 。 对 于 词 频 问题 以 外 的 问题 ，Map 步骤 可 能 不 仅仅 返回 一 个 元 组 。 
我 们 将 在 本 节 后 面 看 到 一 个 例子 。 因 此 ,我 们 坚持 将 Map 函数 返回 一 个 元 组 列表 。 


MapReduce 的 中 间 步 骤 称 为 Partition (分 区 ) 步 又， 将 intermediatel 的 子 列表 中 
key 相同 的 所 有 对 组 合 起 来 : 


(key, value1), (key, value2), ... (key, valuek) 


对 于 每 个 唯一 的 key， 创 建 一 个 新 的 (key，values) 对 ， 其 中 values 是 列表 [valuel， 
value2，…valuek]。 这 个 步骤 封装 在 曙 数 partition() 中 : 


模块 : ch12.py 


!' def partition(intermediatel): 

'''intermediatel is a list containing [(key, value)] lists; 
returns iterable container with a (key, values) tuple for 
every unique key in intermediatei; values is a list that 
contains all values in intermediatel associated with key 


= 区 #( key ，value ) 对 的 字典 


# 对 于 intermediatel 中 每 个 列表 的 每 个 (key ，value) 对 
for lst in intermediatel : 
for key, value in lst: 


3 if key in dct: # 如 果 key 已 经 存在 于 字典 dct 中 ， 
14 dct [keyj .append(value) # 则 将 value 添加 到 列表 dct[key] 中 


else: # 如 果 key 未 存在 于 字典 dct 中 ， 
本 dct [key] = [value] # 则 将 (key，[ value]) 添加 字典 dct 中 ， 


return dct.items() # 返回 (key，values) 元 组 容器 


跑 数 partition() 市 一 个 参数 : intermediate1l。 构 建 列 表 intermediate2: 


>>> intermediate2 = partition(intermediatel) 
>>> intermediate2 
dich 4teomet l(tone.,. Li 1 Ceivwert, ti 1 ta" [EY 
i 人 
最 后 一 步 是 针对 intermediate2 中 的 每 个 (key，values) 对 ， 通 过 累加 values 
中 的 值 来 构建 一 个 新 的 (key， count ) 对 : 


模块 : ch12.py 


def occurrenceCount (keyVal) : 
return (keyVal [0] ，sum(keyVal[L1] ) ) 


同样 ， 列 表 解 析 为 执行 此 步骤 提供 了 一 个 简洁 的 方法 : 

>>> [occurrenceCount (X) for x in intermediate2] 

EEC 

这 被 称 为 MapReduce 的 Reduce (减少 ) 步骤 。 困 数 occurrenceCcount () 被 称 为 词 
频 问 题 的 Reduce 因数 。 


12.3.3 MapReduce 的 抽象 概念 


在 上 一 节 中 我 们 用 来 计算 单词 频率 的 MapReduce 方法 似乎 是 一 种 笨拙 而 奇怪 的 计算 词 
频 的 方法 。 可 以 把 它 看 作 是 我 们 在 第 6 章 所 讨论 的 基于 字典 的 方法 的 一 个 更 复杂 版 本 。 然 
而 ，MapReduce 方法 有 其 优点 。 第 一 个 优点 是 该 方法 是 一 个 通用 方法 ， 适用 于 一 系列 的 问 
题 。 第 二 个 优点 是 ， 它 适合 于 使 用 多 个 计算 节点 而 不 是 一 个 来 实现 ,计算 市 点 可 以 是 中 央 处 
理 器 (CPU) 上 的 多 个 核心 ， 还 可 以 是 云 计算 系统 中 的 数 千 个 节点 。 

下 一 节 我 们 将 深入 探讨 第 二 个 优点 。 现 在 要 做 的 是 对 MapReduce 的 步骤 进行 抽象 ， 以 
使 得 通过 简单 地 定义 特定 的 Map 函数 和 Reduce 晴 数 ， 就 可 以 让 该 框架 用 于 一 系列 不 同 的 
问题 。 简 而 言 之 ， 我 们 的 目标 是 开发 一 个 SeqMapReduce 类 ， 可 以 按 下 列 方式 方便 地 计算 
词 频 : 

>>> words = ['two', 'three', 'one', 'three', 'three', 

PV On! ve’] 
>>> smr = SeqMapReduce(occurrence, occurrenceCount) 


>>> smr.process (words) 
和 


我 们 可 以 使 用 seqMapReduce 对 象 smr 计算 其 他 东西 的 频率 。 例 如 ， 计 算数 值 的 


>>> numbers = [2,3,4,3,2,3,5,4,3,5,1] 
>>> smr.process (numbers) 
加 Ca 2 (3 4)， (4, (5 5 惫 和 


此 外 ， 通 过 指定 其 他 特定 问题 的 Map 盟 数 和 Reduce 函数 ， 我们 可 以 解决 其 他 问题 。 

这 些 规范 建议 类 SeqMapReduce 应 该 包含 一 个 以 Map 和 Reduce 哨 数 作为 输入 参数 
的 构造 函数 。 方 法 process 应 该 带 一 个 包含 数据 的 可 迭代 对 象 作为 参数 ， 并 执行 Map、 
Partition 和 Reduce 步骤 : 
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模块 : ch12.py 


class SeqMapReduce(object) : 
' 一 个 序列 化 的 MapReduce 实现 ， 
def __init__(self, mapper, reducer): 
' 函数 mapper 和 reducer 针对 问题 定制 ' 
self .mapper = mapper 
self.reducer = reducer 
def process(self, data): 


' 使 用 mapper 和 reducer 函数 在 数据 上 运行 MapReduce' 
intermediatel = [self.mapper(x) for x in data] # Map 
intermediate2 = partition(intermediate1) 
return [self.reducer(x) for x in intermediate2] # Reduce 


注意 事项 : MapReduce 的 输入 应 该 为 不 可 变 对 象 
假设 我 们 希望 计算 列表 Lists 的 子 列表 的 频率 : 
3 
看 起 来 似乎 可 以 采用 与 计算 字符 串 和 数值 的 相同 的 方法 : 


>>> smr = SeqMapReduce(occurrence, occurrenceCount) 
>>> smr.process(lists) 
Traceback (most recent call last): 


TypeError: unhashable type: 'list' 


结果 呢 ? 发 生 了 什么 ? 问题 的 根源 在 于 列表 不 能 作为 巴 数 partition() 实现 中 的 
字典 dct 的 键 。 我 们 的 方法 只 适用 于 可 哈 布 的 、 不 可 变 对 象 数 据 类 型 。 如 果 把 列表 更 改 
为 元 组 ， 我 们 可 以 完成 任务 : 

9 


>>> m.process(lists) 


Peli 23 2) (2 Ba 


12.3.4 倒 排 索引 


接 下 来 ,我 们 应 用 MapReduce 框架 来 解决 倒 排 索引 问题 (也 被 称 为 反 向 索引 问题 ) 。 这 
个 问题 有 很 多 版 本 。 我 们 考虑 的 版 本 是 : 给 定 一 组 文本 文件 ， 找 出 哪个 词 出 现在 哪个 文件 
中 。 这 个 间 题 的 一 种 解决 方案 可 以 表示 为 映射 每 个 单词 到 包含 它 的 文件 列表 的 映射 。 这 种 映 
射 称 为 倒 排 索引 。 

例如 ， 假 设 我 们 要 为 如 图 12-14 所 示 的 文本 文件 a.txt、b.txt 和 c.txt 构建 倒 排 


全 F A bl? 
Paris, Miami Tokyo Calro, Cairo 





Tokyo, Miami Tokyo, Quito Paris 
图 12-14 三 个 文本 文件 。 倒 排 索引 把 每 个 单词 映射 到 包含 单词 的 文件 


例如 ， 倒 排 索引 会 把 'Paris' 映射 到 列表 ['a.txt',，'c.txt']，'Quito' 映射 
到 ['b.txt']。 因 此 倒 排 索引 应 该 为 : 


360 锚 12 恒 


[人 


Cd {tno ss Lbitrr’ ily, 
上 


要 使 用 MapReduce 来 获取 倒 排 索 引 ， 我 们 必须 定义 Map 和 Reduce 困 数 ， 把 文件 名 


列表 


[a, Vr! TD. "ett 1! 


作为 参数 ， 产 生 倒 排 索引 。 图 12-15 显示 了 这 些 函 数 如 何 工 作 。 
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图 12-15 倒 排 索引 问题 的 MapReduce。Map 步骤 为 文件 中 的 每 一 个 word 创建 一 个 元 组 
(word， file)。Partition 步骤 收集 相同 word 的 元 组 。Partition 步骤 的 输出 结果 是 
期 望 的 倒 排 索 引 ， 把 单词 映射 到 包含 单词 的 文件 。Reduce 步骤 没有 对 Partition 步骤 


的 输出 结果 做 任何 修改 
在 Map 阶段 ，Map 图 数 为 每 个 文件 创建 一 个 列表 。 


个 列表 包含 文件 中 的 每 个 单词 的 


元 组 (word，file)。 了 员 数 getWordsFromFile() ts Map 男 数 : 


模块 : ch12.py 


from string import punctuation 
def getWordsFromFile(file) : 

'' 为 文件 中 的 每 个 单词 ， 
4 返回 项 [( word ，file )] 的 列表 ， 
5 infile = open(file) 
content = infile.read() 
infile.close() 


0) ls 


3 # 删除 标点 符号 ( 4.1 节 涉 及 ) 


10 transTable = str.maketrans(punctuation, ' 


11 content = content.translate(transTable) 


03 # 构造 没有 重复 项 的 [( word ，file )] 集合 ) 


二 


'*len(punctuation)) 
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for word in content.split(): 
res.add((word, file)) 
return res 


注意 ， 这 个 Map 函数 返回 一 个 集合 ， 而 不 是 一 个 列表 。 这 不 是 问题 ， 因 为 唯一 的 
要 求 是 返回 一 个 可 和 迭代 的 容 需 。 我 们 使 用 集合 的 理由 是 可 以 保证 没有 重复 项 [ (word,， 
file)]， 因 为 重复 项 没有 必要 ， 只 会 降低 Partition 和 Reduce 步骤 的 速度 。 

Map 步骤 完成 后 ，Partition 困 数 将 把 所 有 相同 word 值 的 元 组 (word， file) 结合 
一 起 并 合并 成 一 个 元 组 (word， files)， 其 中 files 是 包含 word 的 所 有 文件 的 列表 。 
换言之 ，Partition 函数 构造 了 倒 排 索引 1。 

这 意味 着 不 需要 Reduce 步骤 执行 任何 操作 。Reduce 也 数 仅仅 把 项 拷贝 到 结果 列表 一 一 
倒 排 索引 。 


模块 : ch12.py 


' def getWordIndex(keyVal) : 
return keyVal 


要 计算 倒 排 索引 ， 只 需要 执行 如 下 操作 : 


Dy Lon = [ia tt". Wh Ta GSR 

>>> print (SeqMapReduce (getWordsFromFile, getWordIndex). 
process (files)) 

LErparwis!:, Le tant! “wr ly CHiamir, [ta tb!) 

(Ceairvo™, Le. tT |) CMmuito, Letatt, "b.trtt]ly, 

( "Tokyo ， La 'bB. txt'|)]| 


时 2 有 英和 浊 ”开发 一 个 基于 MapReduce 的 解决 方案 ， 构 建 一 个 单词 列表 的 倒 排 “ 字 
符 索 引 ”。 要 求索 引 把 至 少 出 现在 一 个 单词 中 的 字符 映射 到 包含 该 字符 的 单词 列表 。 你 的 工 
作 和 包含 设计 Map 函数 getChars() 和 Reduce 函数 getCharIndex( ) 。 


>>> mp = SeqMapReduce(getChars, getCharIndex) 
S57 pp. process(t dt', beae', at's dog's ‘ell) 


和 
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LT Mm rs ds Cm ae 
Em Lomb 1 


12.4 ”并 行 计算 

当今 的 计算 常常 需要 处 理 大量 的 数据 。 一 个 搜索 引擎 不 断 地 从 数 十 亿 的 网 页 中 提取 信 
奶 。 在 瑞士 的 日 内 瓦 附 近 的 大 型 强 子 对 撞 机 上 运行 的 粒子 物理 实验 ， 每 年 产生 万 浪 字 市 的 数 
据 ， 用 以 处 理 并 回答 关于 宇宙 的 基本 问题 。 很 多 公司 (如 Amazon、eBay 和 Facebook) 每 天 
记录 数 以 百 万 的 交易 记录 并 在 他 们 的 数据 挖掘 程序 中 使 用 这 些 数据 。 

没有 一 台 计 算 机 强大 到 足以 解决 我 们 刚才 所 描述 的 那 类 问题 。 当 今世 界 ， 许 许多 多 的 处 
理 硕 被 用 来 并 行 处 理 大 型 数据 集 。 在 本 节 中 ， 我 们 将 介绍 并 行 编程 和 一 个 能 够 利用 大 多 数 当 
前 计算 机 上 可 用 的 多 个 内 核 的 Python API。 虽 然 分 布 式 系统 上 的 并 行 计 算 的 实际 细节 超出 了 
本 教程 的 范围 ， 但 我 们 在 本 章 中 介绍 的 一 般 原 则 也 适用 于 这 类 计算 。 


362 锡 12 萌 


12.4.1 并 行 计算 简介 


直到 21 世纪 初 ， 大 多 数 个 人 计算 机 的 微 处 理 占 只 有 一 个 核心 ( 即 处 理 单元 )。 这 意味 看 
在 该 机 器 上 同时 只 能 执行 一 个 程序 。 从 21 世纪 初 开始 ， 主 要 的 微 处 理 硕 制造 商 〈《 如 英特尔 
和 AMD ) 开始 销售 包含 多 个 处 理 单元 (通常 称 之 为 内 核 ) 的 微 处 理 融 。 现 在 销售 的 几乎 所 有 
的 个 人 计算 机 和 很 多 无 线 设 备 的 微 处 理 需 都 有 两 个 或 多 个 内 核 。 到 目前 为 止 ， 我 们 开发 的 程 
序 没 有 使 用 多 个 内 核 。 为 了 利用 这 些 优势 ,我们 需要 使 用 一 种 Python 并 行 编程 API。 


知识 拓展 : 摩尔 定律 

1965 年 ， 英 特 尔 联合 创始 人 戈 登 .摩尔 预测 ， 微 处 理 器 芯片 上 的 晶体 管 数 量 每 两 年 
会 翻 一 倍 。 令 人 惊讶 的 是 ， 他 的 预测 迄今 为 止 一 直 没 有 改变 。 由 于 晶体 管 密度 的 指数 增 
长 ， 微 处 理 器 的 处 理 能 力 ( 以 每 秒 指令 数 来 衡量 ) 在 过 去 几 十 年 中 取得 了 巨大 的 增长 。 

增加 晶体 管 密度 可 以 通过 两 种 方式 提高 处 理 能 力 。 一 种 方法 是 基于 下 列 情况 : 如 果 晶 
体 管 结合 更 紧密 ， 则 指令 执行 速度 更 快 。 因 此 ， 我 们 可 以 减少 指令 执行 的 间隔 ( 即 增加 处 
理 器 时 钟 频率 )。 到 21 世纪 初 ， 微 处 理 器 制造 商 正 是 这 样 做 的 。 

随 着 时 钟 频率 的 增加 ， 功 耗 也 会 增加 ， 从 而 产生 了 过 热 等 问题 。 因 此 ， 另 一 种 提高 处 
理 能 力 的 方法 是 将 密集 的 晶体 管 重组 成 多 个 可 以 并 行 执 行 指令 的 内 核 。 这 种 方法 也 最 终 增 
加 了 每 秒 可 以 执行 的 指令 数 。 近 日 ， 处 理 器 制造 商 已 经 开始 使 用 第 二 种 方法 ， 生 产 双核 、 
四 核 、 八 核 甚至 更 多 内 核 的 处 理 器 。 微 处 理 器 结构 的 这 一 根本 性 变化 是 一 个 机 遇 ， 也 是 一 
个 挑战 。 使 用 多 个 内 核 编写 程序 比 单 核 编程 复杂 得 多 。 


12.4.2 multiprocessing 模块 中 的 Pool 类 


如 果 你 的 计算 机 具有 多 个 内 核 的 微 处 理 器 ， 则 可 以 将 一 些 Python 程序 的 执行 分 成 奉 干 
任务 ， 这 些 任务 可 以 由 不 同 的 内 核 并 行 运行 。 在 Python 中 这 样 做 的 一 个 方法 是 使 用 标准 库 
模块 multiprocessing。 

如 果 不 知 道 你 的 计算 机 有 多 少 个 内 核 ， 可 以 使 用 模块 multiprocessing 中 的 也 数 
cpu_count ( ) 来 获取 : 


>>> from multiprocessing import cpu_count 
>>> cpu_count() 
8 


你 的 计算 机 可 能 拥有 更 少 或 更 多 的 内 核 。 有 了 八 个 内 核 ， 从 理论 上 讲 程序 执行 速度 可 以 
快 八 信 。 要 达到 这 个 速度 ， 你 必须 把 你 要 解决 的 问题 分 成 八 个 相等 的 大 小 ， 然 后 让 每 个 内 核 
并 行 处 理 一 块 。 不 幸 的 是 ， 并 不 是 所 有 的 问题 都 能 被 分 解 成 同样 大 小 的 碎片 。 但 也 存在 一 些 
问题 (特别 是 数据 处 理 问 题 ) 是 可 以 这 样 划 分 的 ， 它们 激发 了 本 广 的 讨论 。 

我 们 使 用 multiprocessing 模块 中 的 Pool 类 将 一 个 问题 分 割 成 碎片 然后 并 行 执行 。 
一 个 Pool 对 象 表示 一 个 或 者 多 个 进程 的 进程 池 ， 每 个 进程 都 可 以 独立 地 在 可 用 的 处 理 带 内 
核 中 执行 。 


知识 拓展 : 什么 是 进程 ? 
一 个 进程 通常 被 定义 为 “执行 中 的 程序 ” ， 但 这 意味 着 什么 呢 ? 当 一 个 程序 在 计算 机 
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上 执行 时 ， 它 在 一 个 “环境 ”中 执行 。 这 个 “环境 跟踪 所 有 的 程序 指令 、 变 量 、 程 序 栈 、 
CPU 的 状态 ， 等 等 。 这 个 “环境 ”是 由 底层 操作 系统 创建 的 ， 以 支持 程序 的 执行 。 这 个 
“环境 ”就 是 我 们 所 说 的 一 个 进程 。 

现代 计算 机 是 多 处 理 技术 ， 这 意味 着 它们 可 以 并 发 运行 多 个 程序 (或 者 更 准确 地 说 ， 
多 个 进程 )。 并 发 这 个 词 并 不 意味 着 “同时 ”， 在 单个 内 核 的 微 处 理 器 计算 机 体系 结构 中 ， 
只 有 一 个 进程 可 以 在 给 定 的 时 间 点 上 执行 。 在 这 种 情况 下 ， 并 发 意味 着 ， 在 任何 给 定 的 时 
间 点 上 ， 都 有 多 个 进程 (执行 中 的 程序 )， 其 中 一 个 进程 实际 上 使 用 CPU 并 正在 执行 ， 其 
他 进程 被 中 断 ， 等 待 操作 系统 将 CPU 分 配给 它们 。 在 多 核 计算 机 体系 结构 ， 情 况 是 不 同 
的 : 几 个 进程 可 以 在 同一 时 间 在 不 同 的 内 核 上 运行 。 


我 们 在 一 个 简单 的 示例 中 演示 类 Pool 的 使 用 方法 : 


模块 : parallel.py 
1 from multiprocessing import Pool 
Pool = Pool(2) # 创建 两 个 进程 的 进程 池 
animals = [hawk'，'hen'，'hog'，'hyena'] 
s res = pool.map(len,，animals) # 在 列表 animals 的 每 一 个 项 上 应 用 len() 函数 


a print(res) # 打印 字符 串 长 度 列表 的 内 容 


这 个 程序 使 用 包括 两 个 进程 的 进程 池 来 计算 列表 animals 中 字符 串 的 长 度 。 当 你 在 系 
统 的 命令 行 (不 是 Python 交互 式 命令 行 ) 中 执行 此 程序 时 ， 结 果 如 下 : 
> python parallel.py 
[可 。， 岛 。 导 | 
因此 ， 在 程序 parallel.py 中 ，map() 方法 把 限 数 len( ) 应 用 到 列表 animals 的 
每 一 个 项 ， 然 后 返回 获得 值 的 新 列表 。 表 达 式 : 


pool.map(len, animals) 
和 列表 解析 表达 式 : 
[len(x) for x in animals)] 


二 者 执行 相同 的 操作 ， 求 值 计算 结果 值 相 同 。 唯 一 的 不 同 之 处 在 于 如 何 操作 。 

与 列表 解析 方法 不 同 ， 在 基于 Pool 的 方法 中 使 用 两 个 进程 把 也 数 len( ) 应 用 到 列表 
animals 的 每 一 个 项 。 如 果 主 机 至 少 包 括 两 个 内 核 ， 则 处 理 天 可 以 同时 〈《 即 并 行 ) 执行 两 
个 进程 。 

要 演示 两 个 进程 同时 执行 的 效果 ， 我 们 修改 程序 Parallel.pPy 以 显 式 展示 处 理 列 
表 animals 中 不 同 项 的 不 同 进程 。 要 区 分 不 同 进程 ， 我 们 使 用 一 个 方便 的 事实 : 每 个 
进程 都 有 一 个 唯一 的 整数 ID。 进 程 的 ID 可 以 使 用 标准 库 模 块 os 中 的 getpid() 男 数 
获得 : 
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模块 : parallel.py 


from multiprocessing import Pool 
from os import getpid 


+ def length(word) : 
' 返回 字符 串 单词 的 长 度 ， 


# 打印 执行 函数 的 进程 的 id 
print('Process {} handling {}'.format(getpid(), word)) 
return len(word) 


# 主 程序 

2 pool = Pool (2) 

res = pool.map(length, ['hawk', 'hen', 'hog', 'hyena']) 
print (res) 


和 len() 一 样 ， 函 数 length() 惠 一 个 字符 串 参 数 ， 返 回 其 长 度 ， 同 时 还 输出 执行 该 
因数 的 进程 的 ID。 当 我 们 在 系统 的 命令 行 (不 是 Python 交互 式 命 令 行 ) 中 执行 此 程序 时 ， 
结果 类 似 如 下 : 

> python parallel2.py 

Process 36715 handling hawk 

Process 36716 handling hen 

Process 36716 handling hyena 


Process 36715 handling hog 
人 


因此 ，ID 为 36715 的 进程 处 理 字 符 串 'hawk' 和 'hog'， 而 ID 为 36716 的 进程 处 理 
字符 串 'hen' 和 'hyena'。 在 具有 多 个 内 核 的 计算 机 上 ， 进 程 可 以 完全 并 行 执行 。 


注意 事项 : 为 什么 不 在 交互 式 命令 行 中 运行 并 行程 序 ? 
由 于 超出 本 书 范围 的 技术 原因 ， 在 某 些 操作 系统 平台 上 不 可 能 在 交互 式 命令 行 中 使 用 
Pool 运行 程序 。 出 于 这 个 原因 ， 我 们 在 主机 操作 系统 的 命令 行 中 运行 所 有 使 用 进程 池 的 
程序 。 


要 更 改 paralle12 .py 中 进程 池 的 大 小 ， 只 需要 改变 Pool 构造 遇 数 的 输入 参数 。 当 
使 用 Pool( ) 默认 构造 也 数 ( 即 没 有 指定 进程 池 大 小 时 ) 构建 一 个 进程 池 时 ，Python 会 日 己 
确定 分 配 多 少 个 进程 。 分 配 的 进程 数 不 会 超过 主机 的 内 核 数 。 

编写 程序 notParallel.py, 一 个 parallel2 .py 的 列表 解析 版 本 
运行 并 检查 使 用 了 多 少 个 进程 。 然 后 运行 paralle12 .py 若干 次 : 进程 池 大 小 分 别 为 1、3、 
4， 以 及 使 用 Pool() 默认 构造 函数 。 


12.4.3 并行 加 速 比 

为 了 说 明 并 行 计 算 的 优越 性 ， 我 们 讨论 一 个 数论 中 计算 密集 型 的 问题 。 我 们 想 比 较 素 数 
在 几 个 任意 整数 范围 内 的 分 布 。 更 确切 地 说 ， 我 们 和 希望 在 几 个 相同 大 小 范围 ( 100 000 个 大 
整数 ) 计算 素数 的 个 数 。 

假设 其 中 一 个 范围 是 从 12 345 678 到 但 不 包括 12 445 678。 为 了 在 这 个 范围 内 
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查找 素数 ， 我 们 可 以 简单 地 遍历 范围 内 的 数值 ， 并 检查 每 个 数值 是 否 为 素数 。 国 数 
countPrimes() 使 用 列表 解析 实现 这 个 想法 : 


模块 : primeDensity.py 
from os Import getpid 


def countPrimes (start): 


' 返回 在 数值 [ start ，start + rng ) 范围 内 的 所 有 素数 ， 


rng = 100000 
formatStr = 'process {} processing range [{}, {})' 
print (formatStr.format (getpid(), start, start+rng)) 


10 # 对 数值 [ start ，start + rng ) 范围 内 的 所 有 素数 并 求 累 加 和 


return sum([1 for i in range(start,start+rng) if prime(i)]) 


湖 数 prime( ) 市 一 个 正 整 数 参 数 ， 如 果 是 素数 则 返回 True， 否 则 返回 False。 这 是 
思考 题 5.36 的 答案 。 我 们 使 用 下 一 个 程序 来 计算 也 数 countPrimes( ) 的 执行 时 间 : 


模块 : primeDensity.py 


from multiprocessing import Pool 
from time import time 


1 if name , ==; main _':! 
p = Pool() 
# Starts 是 整数 范围 的 左边 界 列 表 
starts = [12345678，23456789，34567890 ，45678901 ， 
56789012 ，67890123 ，78901234 ，89012345] 


tl = time() # 开始 时 间 
print (p.map(countPrimes, starts)) # 运行 countPrimes() 函数 
t2 = time() # 结束 时 间 

i p.close() 


print('Time taken: {} seconds.'.format (t2-t1)) 


如 采 修 改行 P = Pool() 为 p = Pool(1)， 则 进程 池 只 有 一 个 进程 ， 软 出 结 来 如 下 : 


> python map.py 

process 4176 processing range [12345678，12445678] 
process 4176 processing range [23456789，23556789] 
process 4176 processing range [34567890，34667890j] 
process 4176 processing range [45678901, 45778901] 
process 4176 processing range [56789012,56889012] 
process 4176 processing range [67890123，67990123] 
process 4176 processing range [78901234, 79001234] 
process 4176 processing range [89012345,89112345] 
[6185，5900，5700，5697，5551，5572，5462，5469] 
Time taken: 47.84 seconds. 


言 之 ， 单 个 进程 处 理 所 有 八 个 整数 范围 ， 耗 时 47.84 秒 (运行 时 间 在 不 同 的 计算 机 上 
可 能 会 有 差异 )。 如 果 我 们 采用 两 个 进程 的 进程 池 ， 则 可 以 显著 提升 运行 时 间 为 24.60 秒 。 
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因此 ， 通 过 使 用 两 个 内 核 代 替 一 个 内 核 ， 我 们 几乎 将 运行 时 间 缩 减 了 一 半 。 

一 种 比较 顺序 运行 时 间 和 并 行 运行 时 间 的 更 好 方法 是 加 速 比 (speedup)， 即 顺序 运行 时 

间 和 并 行 运行 时 间 的 比率 。 在 这 种 特殊 情况 下 ， 我 们 的 加 速 比 为 : 
47.84 
24.6 

这 意味 着 两 个 进程 (在 两 个 不 同 的 内 核 上 运行 ) 时 ， 我 们 解决 问题 的 速度 变 为 原来 的 
1.94 倍 (或 者 几乎 两 倍 )。 注 意 ， 从 本 质 上 来 说 ， 这 是 我 们 所 能 期 望 的 最 好 结果 : 并 行 执行 
的 两 个 进程 的 速度 最 多 可 以 是 一 个 进程 的 两 倍 。 

四 个 进程 时 ， 我 们 进一步 提高 了 运行 时 间 : 16.78 秒 ， 这 对 应 的 加 速 比 为 
47.84/16:78 半 2.8$。 请 注意 ， 四 个 进程 在 四 个 独立 内 核 上 运行 的 最 佳 加速 比 是 4。 八 个 进程 
时 ， 我 们 进一步 提高 了 运行 时 间 : 14.29 秒 ， 这 对 应 的 加 速 比 为 47.84/14:29 盖 3.35。 当 然 ， 
最 好 的 可 能 值 是 8。 
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12.4.4 并行 MapReduce 


掌握 了 列表 解析 的 并 行 版 本 之 后 ， 我 们 可 以 修改 第 一 个 顺序 MapReduce 的 实现 ， 实 现 
一 个 可 以 并 行 运行 Map 和 Reduce 的 版 本 。 唯 一 要 修改 的 是 在 构造 另 数 中 增加 一 个 可 选 的 输 
入 参数 : 所 需 的 进程 数 。 


模块 : ch12.py 


from multiprocessing import Pool 
' class MapReduce(object): 
'MapReduce 的 一 个 并 行 实现 ，' 


def __init__(self, mapper, reducer, numProcs=None): 
' 初始 化 map 和 reduce 函数 ， 以 及 进程 池 ， 
self .mapper = mapper 
self.reducer = reducer 
self.pool = Pool (numProcs) 


修改 方法 process()， 在 Map 和 Reduce 步骤 中 使 用 Pool 方法 map() 代替 列表 解析 。 


模块 : ch12.py 


def process(Sself，data) : 
' 在 序列 数据 上 运行 MapReduce， 


intermediatel = self.pool.map(self.mapper, data) # Map 
intermediate2 = partition(intermediate1) 
return self.pool.map(self.reducer, intermediate2) # Reduce 


12.4.5 ”并 行 和 顺序 MapReduce 


我 们 使 用 MapReduce 的 并 行 实现 来 解决 名 称 交 义 检 查 问题 。 假 设 成 千 上 万 的 已 经 分 类 
的 文档 刚刚 在 网 上 发 布 ， 这 些 文档 提 到 了 各 种 各 样 的 人 名 。 你 硕 望 在 这 些 文档 中 查找 所 及 特 
定 人 名 的 文档 ， 而 且 和 希望 为 一 个 或 多 个 文档 中 的 所 有 人 和 名 执行 相同 操作 。 为 了 方便 ， 所 有 的 
人 名 是 大 写 的 ， 这 帮 你 缩小 了 可 能 是 正确 人 名 的 单词 的 范 围 。 
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我 们 将 要 解决 的 确切 问题 是 : 给 定 一 个 (包含 文档 的 ) URL 列表 ,希望 获得 一 个 
(proper，urlList) 对 列表 ， 其 中 proper 是 任何 文档 中 的 大 写 单 词 ，urlList 是 
包含 proper 的 文档 的 URL 列表。 为 了 使 用 MapReduce， 我们 需要 定义 Map 和 Reduce 

Map 因数 带 一 个 URL 参数 ， 需 要 构建 一 个 (key，value) 对 的 列表 。 在 本 问题 中 ，URL 
指定 的 文档 中 的 每 个 大 写 单词 都 有 一 个 (key，value) 对 ， 其 中 单词 是 键 ， 而 URL 是 值 。 因 
此 Map 隔 数 如 下 所 示 : 


模块 : ch12.py 


from urllib.request Import urlopen 
:from re import findall 


: def getProperFromURL ur1) : 
:为 每 个 出 现在 url 相关 网 页 内 容 中 
的 单词 返回 项 [( word ，url )] 列表 ''' 


content = Urlopen(Cur1) .read() .decode() 
attern = "EN=2] RN] # 大 写字 母 单 词 的 正则 表达 式 
propers = set(findall(pattern，content)) # 删除 重复 项 


res = [] # 对 于 每 个 大 写字 母 的 单词 

for word in Propers: # 创建 ( word,url) 对 
res.append((word, url)) 

return res 


在 第 9 行 中 使 用 正则 表达 式 (在 第 8 行 定 义 ) 来 查找 大 写字 母 (要 复习 正则 表达 式 ， 请 
参见 11.3 )。 通 过 把 re 函数 findall() 返回 的 列表 转换 为 集合 过 滤 掉 重复 单词 ， 因 为 不 
需要 重复 单词 ， 而 且 这 可 以 加 速 接 下 来 的 Partition 和 Reduce 步 又 。 

MapReduce 的 Partition 步骤 把 Map 步骤 的 输出 结果 作为 输入 参数 ， 合 并 key 相同 的 所 
有 (key，value) 对 。 在 这 个 特定 问题 中 ，Partition 步骤 的 结果 是 每 个 大 写 单 词 的 (word， 
urls) 对 ，urls 是 包含 word 的 所 有 文档 的 URL 列表 。 因 为 这 正 是 我 们 需要 的 结果 ， 所 
以 Reduce 步骤 不 需要 任何 处 理 操作 : 


模块 : ch12.py 


def getWordIndex(keyVal) : 
' 返回 输入 值 ， 
3 return keyVal 


如 何 比 较 我 们 的 顺序 实现 和 并 行 实现 呢 ?在 接 下 来 的 代码 中 ， 我 们 开发 了 一 个 测试 程 
序 ， 比 较 了 顺序 实现 和 四 个 进程 的 并 行 实现 的 运行 时 间 (测试 是 在 一 台 有 八 个 内 核 的 机 大 上 
运行 的 )。 作 为 我 们 使 用 的 分 类 文档 的 替代 ， 测 试 数据 使 用 了 查尔斯 :狄更斯 的 八 本 小 说 ， 
由 古 腾 堡 项目 (又 称 为 古 腾 保 计划 、 古 腾 保 工程 ) 公开 提供 : 

模块 : ch12.py 


from time import time 


1f vane Se !, main ,.! 


世人 :二 荆 


http: 


-所 老 耻 


http: 
"htt 
“i 
tp 
Htp: 
tt 


/ /WWNW. 
:/ /WWw. 
/ /WwWW. 
// WWW . 
//WWW. 
//WWw . 
//Wuw. 
/ /WwWW， 


# 八 本 狄更斯 小 说 的 URL 


gutenberg. 
.org/cache/epub/1400/pg1400 .txt ' ， 


gutenberg 


gutenberg. 
gutenberg. 
gutenberg. 
gutenberg. 
gutenberg. 
gutenberg. 


org/cache/epub/2701/pg2701 .txt', 


org/cache/epub/46/pg46 .txt '， 
org/cache/epub/730/pg730.txt', 
org/cache/epub/766/pg766.txt'!, 
org/cache/epub/1023/pg1023.txt', 
org/cache/epub/580/pg580 .txt ' ， 
org/cache/epub/786/pg786 .txt 


1 tl = time()  # 顺序 开始 时 间 

16 SeqMapReduce (getProperFromURL, getWordIndex) .process(urls) 
17 t2 = time()  # 顺序 结束 时 间 、 并 行 开始 时 间 

18 MapReduce (getProperFromURL, getWordIndex, 4).process(urls) 
{9 t3 = time() ## 并 行 结束 时 间 


{:5.2f} seconds.' ,format(t2=t+1)) 
{:5.2f} seconds.' .format(t3-t2)) 


2 print('Sequential: 
print('Parallel: 


让 我 们 运行 测试 : 


> Python ch12.py 
Sequential: 19.89 seconds. 
Parallel: 14.81 seconds. 


因此 ， 四 个 内 核 时 ， 运 行 时 间 减 少 了 5.08 秒 ， 对 应 于 加 速 比 为 : 
19.89 
14.81 
由 个 站 模 的 最 佳 如 速 比 为 4。 在 这 个 示例 中 ， 我 们 使 用 四 个 内 核 ， 所 得 的 加 速 比 为 
这 与 理论 上 的 最 佳 加 速 比 4 有 一 定 差距 。 
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知识 拓展 : 为 什么 不 能 获得 更 好 的 加 速 比 ? 

我 们 不 能 获得 更 好 的 加 速 比 的 一 个 原因 是 并 行 运行 程序 时 总 有 开销 。 在 管理 不 同 
内 核 上 和 运行 的 多 个 进程 时 ， 操 作 系 统 有 额外 的 工作 要 做 。 另 一 个 原因 是 ， 我 们 的 并 行 
MapReduce 实现 Map 和 Reduce 步骤 并 行 的 同时 ，Partition 步骤 仍然 是 顺序 的 。 对 于 在 
Partition 步骤 中 产生 非常 大 的 中 间 列 表 的 问题 ，Partition 步骤 将 与 顺序 实现 耗费 相同 的 长 
时 间 。 这 大 大 地 减少 了 并 行 Map 和 Reduce 步骤 的 优越 性 。 

Partition 并 行 化 也 是 可 能 的 ， 但 其 实现 需要 访问 正确 配置 的 谷歌 公司 使 用 的 一 种 分 布 
式 文 件 系统 。 事 实 上 ， 这 种 分 布 式 文件 系统 是 谷歌 公司 在 开发 MapReduce 框架 中 做 出 的 
真正 的 贡献 。 

在 练习 题 12.8 中 ， 我 们 将 开发 一 个 程序 ， 包 含 
耗 时 的 Partition 步 又， 你 将 看 到 更 好 的 加 速 比 。 


一 个 更 加 耗 时 的 Map 步骤 和 一 个 不 大 


有 中 入 启 时 P 玉 ”给 定 一 个 正 整 数列 表 ， 要 求 计算 一 个 映射 ， 把 一 个 素数 映射 到 可 以 被 该 
素数 整除 的 所 有 整数 列表 。 例 如 ， 如 果 列 表 是 [24,15,35,60]， 则 映射 为 : 


[i [2 BO tB, Lis S013, 5, LiB, 5 7, L351 
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(素数 2 可 以 整除 24 和 60; 素数 3 可 以 整除 15 和 60; 等 等 。) 

它 被 告知 ， 应 用 程序 的 输入 可 能 是 非常 大 的 整数 列表 。 因 此 ， 必 须 使 用 MapReduce 框 
架 来 解决 这 个 问题 。 为 了 这 样 做 ， 你 需要 为 这 个 特殊 问题 开发 一 个 Map 函数 和 一 个 Reduce 
函数 。 如 果 命 名 为 Mapper() 和 Reducer()， 程序 将 使 用 下 列 方式 获得 上 述 的 映射 : 

>>> SeqMapReduce (mapper, reducer) .process([24,15,35,60]) 

实现 了 Map 函数 和 Reduce 函数 之 后 ， 通 过 开发 一 个 测试 程序 ， 采 用 在 10 000 000 和 
20 000 000 之 间 随 机 抽样 的 64 个 整数 ， 比 较 你 的 顺序 MapReduce 实现 和 并 行 MapReduce 
实现 的 运行 时 间 ， 并 计算 加 速 比 。 你 可 以 使 用 在 模块 random 中 定义 的 函数 sample()。 


12.5 ”电子 教程 案例 研究 : 数据 交换 


在 第 11 章 的 电子 案例 研究 CS.11 中 ， 我 们 开发 了 一 个 简单 的 网 络 肘 虫 ， 收 集 其 访问 的 
网 页 的 信息 。 这 些 信息 又 可 以 用 来 构建 搜索 引擎 。 通 过 将 抓 取 的 数据 保存 到 文件 中 ， 我 们 可 
以 将 这 些 数据 提供 给 其 他 程序 。 在 电子 案例 研究 CS.12 中 ,我 们 讨论 数据 交换 ， 也 就 是 次 如 
何 格式 化 数据 和 保存 数据 使 得 任何 需要 它 的 程序 可 以 方便 上 且 有 效 地 访问 。 


12.6 本章 小 结 


本 章 重 点 介绍 处 理 数 据 的 现代 方法 。 几 乎 每 一 个 现代 的 “真正 的 ”计算 机 应 用 程序 背后 
都 有 一 个 数据 库 。 与 通用 文件 相 比 ， 数 据 库 文件 通常 更 适合 于 存储 数据 。 这 就 是 为 什么 要 及 
时 接触 数据 库 、 了 解 其 优越 性 ， 以 及 知道 其 使 用 方法 。 

本 章 介绍 了 SQL 的 一 个 小 子 集 。SQL 是 用 来 访问 数据 库 类 型 文件 的 语言 。 我 们 还 介绍 
了 Python 标准 库 模块 sqlite3， 这 是 一 个 处 理 这 类 文件 的 API。 在 一 个 存储 Web 疏 虫 抓 取 的 
结果 的 数据 库 文件 上 下 文中 ,我们 展示 了 SQL 和 sqlite3 模块 的 使 用 方法 ， 然 后 进行 了 
搜索 引擎 类 型 的 查询 。 

可 伸缩 性 是 数据 处 理 中 的 一 个 重要 问题 。 目 前 许多 计算 机 应 用 所 生成 和 处 理 的 数据 量 
都 十 分 巨大 。 然 而 ， 并 非 所 有 的 程序 都 能 伸缩 和 处 理 大 量 数据 。 因 而 我 们 对 可 伸缩 的 程序 
设计 方法 特别 感 兴 趣 ( 即 可 以 在 多 个 处 理 器 和 内 核 上 并 行 运行 )。 在 本 和 草 中 ， 我 们 介绍 了 几 
种 可 扩展 的 程序 设计 技术 ， 它 们 源 于 函数 式 语言 。 我 们 首先 介绍 列表 解析 ， 一 种 允许 使 用 
简洁 描述 针对 一 个 列表 中 的 每 个 项 执行 一 个 浮 数 的 Python 构造 。 然 后 我 们 介绍 了 标准 库 
multiprocessing 中 的 函数 map()， 它 的 本 质 是 可 以 使 用 一 个 微 处 理 需 的 可 用 内 核 并 行 
地 执行 列表 解析 。 然 后 ， 我 们 在 此 基础 上 描述 和 开发 了 一 个 谷歌 MapReduce 框架 的 基本 版 
本 。 谷 歌 和 其 他 公司 使 用 这 个 框架 处 理 真 正 的 大 数据 集 。 

虽然 我 们 的 实现 运行 在 一 台 计 算 机 上 ,但 本 童 介绍 的 概念 和 技术 适用 于 一 般 的 分 布 式 计 
算 ， 尤 其 是 现代 云 计 算 系 统 。 


12.7 练习 题 答案 
12.1 SQL 查询 如 下 所 示 : 


(a) SELECT DISTINCT UrlL FROM Hyperlinks WHERE Link = “four.htm]l 
(b) SELECT DISTINCT Link FROM Hyperlinks WHERE Url] = 'four.htm]' 
(C) SELECT Url, Word from Keywords WHERE Freq = 3 
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(d) SELECT * from Keywords WHERE Freq BETWEEN 3 AND 5 


12.2 SQL 查询 如 下 所 示 : 


(a) SELECT SUM(Freq) From Keywords WHERE Url = 'two.html' 
(b) SELECT Count(*) From Keywords WHERE Url = 'two.html' 
(c) SELECT Url, SUM(Freq) FROM Keywords GROUP BY Url 

(d) SELECT Link, COUNT(*) FROM Hyperlinks GROUP BY Link 


12.3 ”请 确保 正确 使 用 参数 替换 ， 不 要 忘记 提交 和 关闭 数据 库 : 


import sqlite3 
def webData(db, url, links, freq): 
'''db is the name of a database file containing tables 
Hyperlinks and Keywords; 


url is the URL of a web page; 

links is a list of hyperlink URLs in the web Page ; 

freq is a dictionary that maps each word in the web page 
to its frequency; 


webData inserts row (url, word, freq[word]) into Keywords 
for every keyword in freq, and record (url, link) into 
Hyperlinks, for every link in links 


con = sqlite3.connect (db) 
cur = ON, eursor() 
for word in freq: 

record = (url, word, freq[word]) 

cur.execute("INSERT INTO Keywords VALUES (?,?,?)", record) 
for link in links: 

record = (url, link) 

cur .execute("INSERT INTO Keywords VALUES (?,?)", record) 
con.commit() 
con.close() 


12.4 搜索 引擎 是 一 个 简单 的 服务 需 程 序 ， 一 直 循环 运行 ， 并 在 每 次 循环 中 为 用 户 搜索 请 求 提供 服务 : 
def freqSearch(Cwebdb) : 


webdb is a database file containing table Keywords; 


freqSearch is a simple search engine that takes a keyword 
from the user and prints URLs of web pages containing it 
in decreasing order of frequency of the Word 

con = sqlite3.connect (webdb) 

cur = con.cursor() 


while True: # 提供 永远 的 服务 
keyword = input("Enter keyword: ") 
# 按照 关键 字 出 现 的 频率 降序 
# 选择 包含 关键 字 的 网 页 
cur.execute("""SELECT Url ，Freq 

FROM Keywords 

WHERE Word = ? 

ORDER BY Freq DESC""", (keyword , ) ) 
printt’{:15}{:4} "format( UREL", FREQ'Y) 
or sl, freqd 5 eur: 

print('{:15}{:4}' .format (url, freq)) 
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12.5 ”列表 解析 构造 如 下 所 示 : , 
(a) [word.capitalize() for word in words]: 每 个 单词 都 大 写 。 
(b) [(word，1len(word)) for word in words]: 为 每 个 单词 创建 一 个 元 组 。 
(c) [[(c,word) for c in word] for word in words]: 使 用 每 个 单词 创建 一 个 列表 ; 
使 用 该 单词 的 每 个 字符 来 创建 列表 ， 同 样 可 以 使 用 列表 解析 来 实现 。 
12.6 ”Map 中 数 应 该 针对 单词 word 的 每 一 个 字符 c， 把 一 个 单词 (字符 串 ) 映射 到 一 个 元 组 (c, word) 
的 列表 。 


def getChars (word): 


‘word is a string; the function returns a list of tuples 
(c, word) for every character c¢ of word''' 
return [(c, word) for c in word] 


reduce 轴 数 的 输入 是 一 个 元 组 (c， lst)， 其 中 是 包含 c 的 单词 列表 。reduce 上 
数 仅仅 从 列表 1st 中 删除 重复 项 : 


def getCharIndex(keyVal) : 
'''keyVal is a 2-tuple (c, lst) Where lst is a list 
of words (strings) 


{Unction Keturns (© lst') Where lst' js lat with 
duplicates removed"™"' 


return (keyVal[0] list(set(keyVal[1]))) 
12.7 程序 代码 如 下 : 


模块 : notParallel.py 


! from os import getpid 


def length(word): 
' 返回 字符 串 单词 的 长 度 ， 
print('Process {} handling {}'.format (getpid(), word)) 
return len(word) 


animals = ['hawk', 'hen', 'hog', 'hyena'] 
print([length(x) for x in animals]) 


当然 ， 执 行 时 仅 使 用 一 个 进程 。 
12.8 map 函数 (我 们 命名 为 divisors()) 带 一 个 number 参数 ， 为 每 一 个 number 的 素数 因子 返 


回 一 个 (i，number ) 对 : 


from math import sqgrt 
def divisors (number): 


returns list of (i, number) tuples for 
every prime i dividing number''' 


Sow = ||] # 数值 因子 的 累积 器 
n = number 
和 
while n > 1: 
if nyi == 0: # 如 果 主 是 n 的 因子 


# 当 羡 是 n 的 因子 时 
# 收集 iY， 并且 n 反复 整除 i 
res.append((i, number)) 
while nhi == 0: 


n //= i 


:| # 跳 转 到 下 一 个 i 
return res 


Partition 步骤 把 相同 key i 谋 的 (i，number) 对 合并 在 一 起 。 其 构造 的 列表 实际 上 就 是 期 
望 的 最 终 列 表 ， 因 此 Reduce 步骤 仅仅 拷贝 (key，value) 对 : 


def identity(keyVal) : 
return keyVal 


程序 的 测试 如 下 : 


from random import sample 
from time import time 
if __name__ == '__main 


# 创建 64 个 大 的 随机 整数 

numbers = sample(range(10000000, 20000000)，64) 

tl = time() 

SeqMapReduce(divisors, identity) .process (numbers) 
t2 = time() 

MapReduce (divisors, identity) .process (numbers) 

t3 = time() 

print('Sequential: {:5.2f} seconds.'.format(t2-t1)) 
print('Parallel: {:5.2f} seconds.'.format(t3-t2)) 


在 一 个 多 内 核 微 处 理 器 的 计算 机 上 运行 这 个 测试 时 ， 可 以 观察 到 并 行 MapReduce 实现 运行 
速度 更 快 。 下 面 是 使 用 四 个 内 核 运 行 的 结果 示例 : 
Sequential: 26.77 seconds. 
Parallel: 11.18 seconds. 


加 速 比 是 2.39。 


12.8 “习题 


12.9 编写 SQL 查询 ， 查 询 图 12-2 中 的 表 Hyper1Links 和 Xeywords， 返 回 下 列 结果 : 
(a) 在 URL four .html 的 网 页 上 出 现 的 不 重复 的 单词 。 
(b) 包含 'Chicago' 或 者 'Paris' 的 网 页 的 URL，。 
(c) 所 有 网 页 中 每 个 不 重复 单词 出 现 的 总 次 数 。 
(d) 从 包含 'Nairobi' 的 网 页 具有 导入 超 链接 的 网 页 的 URL 。 
12.10 ”编写 SQL 查询 ， 查 询 图 12-16 中 的 WeatherData 表 ， 返 回 下 列 结果 : 
(a) 城市 为 London 的 所 有 记录 。 
(b) 所 有 夏天 (summer) 的 记录 。 
(c) 平均 气温 小 于 20 度 的 city 、country 和 season。 
(d) 平均 气温 大 于 20 度 且 总 降水 量 (rainfall) 小 于 10mm 的 city、country 和 season。 
(e) 最 大 的 总 降水 量 (rainfall)。 
(f) 所 有 记录 的 城市 〈city)、 季 节 (season) 和 总 降水 量 (rainfall)， 按 降水 量 的 降序 排列 。 
(g) Cairo, Egypt (埃及 和 开罗 ) 的 年 降水 量 . 
(h) 每 个 不 同城 市 的 城市 名 (city name)、 国 家 (country) 和 年 总 降水 量 
12.11 使 用 模块 sqlite3， 创建 一 个 数据 库 文 件 weather .db， 并 在 其 中 创建 表 WeatherData。. 
在 表 中 定义 如 图 12-16 所 示 的 列 名 称 和 类 型 ， 然 后 插入 图 12-16 所 示 的 所 有 行 记录 。 
12.12 使 用 sqlite3, 在 其 交互 式 命令 行 中 ， 打 开 在 习题 12.11 中 创建 的 数据 库 文件 ， 然 后 通过 运 
行 相应 的 Python 语句 来 执行 习题 12.10 中 的 查询 。 
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City Country Season _ Temperature Rainfall 
Mumbai India | 24.8 3.9 
Mumbai India 2 28.4 16.2 
Mumbai India 3 21.9 1549.4 
Mumbai India 十 27.6 346.0 
London United Kingdom ] 4.2 207.7 
London United Kingdom 2 8.3 169.6 
London United Kingdom 3 19.4 137.0 
London United Kingdom 十 10.4 218.5 
Cairo Egypt ] 1 3 看 16.5 
Cairo Egypt 2 20.7 6.5 
Cairo Egypt 3 py 0.1 
Cairo Egypt 二 22.2 4.5 


图 12-16 世界 天 气 数 据 库 节 选 。 其 中 显示 了 几 个 世界 城市 的 冬天 (1)、 春 天 (2)、 夏 天 (3 ) 


12.13 


12.14 


lL2.13 


12.9 


12.16 


和 秋天 (4 ) 的 24 小 时 平均 气温 (单位 : 摄氏 温度 ) 和 总 降水 量 (单位 : 毫米 ) 
假设 列表 1st 定义 如 下 : 


yo lat = 29 


创建 基于 列表 lst 的 列表 解析 表达 式 ， 生 成 如 下 列表 : 

(a) [3，6，4，9] ( 即 列 表 1st 的 个 位 数 ) 

(b) [12，14，6，4，20]( 即 列表 1st 中 的 偶数 ) 

(c) [12，3，21，14，6，4，9，20] ( 即 列表 1st 中 被 2 或 者 3 整除 的 数 ) 

(d) [4，9]( 即 列表 1st 的 平方 数 ) 

(elj[6，7，3，2，10] ( 即 列表 1st 中 的 偶数 的 一 半 ) 

使 用 一 个 、 两 个 、 三 个 、 四 个 ,或 者 计算 机 上 的 所 有 内 核 来 运行 程序 primeDensity .py， 
并 记录 运行 时 间 。 然 后 编写 一 个 primeDensity .py 程序 的 顺序 版 本 (例如 ,使 用 列表 解析 ) 
并 记录 其 运行 时 间 。 比 较 每 次 primeDensity .py 执行 的 加 速 比 ， 使 用 两 个 或 更 多 内 核 。 
通过 记录 MapReduce 每 一 步 ( Map、Partition 和 Reduce) 的 运行 时 间 ， 微 调 程序 ch12 .py 的 
运行 时 间 分 析 (需要 修改 类 MapReduce)。 哪 一 步 的 加 速 比 更 好 ? 


编写 困 数 ranking()， 带 一 个 输入 参数 : 一 个 数据 库 文 件 的 名 称 ， 数 据 库 包含 图 12-2a 
所 示 的 表 相 同 格式 的 名 为 Hyperlinks 的 表 。 要 求 函 数 向 数据 库 中 增加 一 张 表 ， 包 含 
Hyperlinks 中 Link 列 中 列举 的 所 有 URL 的 导入 超 链接 的 个 数 。 把 新 的 表 和 列 字段 分 别 命 
名 为 Ranks、Url 和 Rank。 在 数据 库 文件 Links .db 的 Rank 表 上 执行 下 列 通 配 符 查 询 时 ， 
结果 如 下 : 

>>> cur.execute('SELECT * FROM Ranks') 

<sqlite3.Cursor object at 0Oxl5d2560> 


>>> Lor TOCord 1n eur” 
print (record) 
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编写 一 个 应 用 程序 ， 带 一 个 输入 参数 : 一 个 文本 文件 名 。 计 算 文 件 中 每 个 单词 的 出 现 频率 ， 并 
把 结果 (word， frequency) 对 保存 到 新 的 数据 库 文件 中 一 个 名 为 Wordcounts 的 新 的 表 
中 。 新 的 表 包 含 列 Word 和 Freq， 用 于 存储 (word，frequency) 对 。 
使 用 海 包 绘图 开发 一 个 应 用 程序 ， 显 示 一 个 文本 文件 中 出 现 频 率 最 高 的 个 单词 。 假 设 文件 中 
的 单词 频率 已 经 统计 并 存储 在 思考 题 12.17 中 创建 的 数据 库 文件 中 。 要 求 你 的 应 用 程序 市 两 个 
输入 参数 : 数据 库 文件 的 名 称 和 数值 &。 程 序 应 该 在 海龟 绘图 屏幕 上 的 随机 位 置 显示 壮 个 出 现 
频率 最 高 的 单词 。 尝 试 设置 单词 使 用 不 同 的 字体 大 小 : 出 现 频率 最 高 的 单词 的 字体 最 大 ， 接 下 
来 两 个 单词 字体 稍 小 些 ， 接 下 来 四 个 单词 的 字体 更 小 些 ， 以 此 类 推 。 
在 练习 题 12.4 中 ， 我 们 开发 了 一 个 简单 的 搜索 引擎 ， 基 于 单词 频率 对 网 页 进行 排序 。 有 好 多 
理由 证 明 这 种 网 页 排序 方式 并 不 好 ， 包 括 该 方式 太 易 于 操作 的 事实 。 

现代 搜索 引擎 (例如 Google) 使 用 超 链接 信息 (包括 其 他 内 容 ) 实现 网 页 排名 。 例 如 ， 如 
果 一 个 Web 页 面 有 很 少 的 导入 链接 ， 它 可 能 不 包含 有 用 的 信息 。 然 而 ， 如 果 一 个 网 页 有 许多 
导入 超 链接 ， 那 么 它 可 能 包含 有 用 的 信息 ， 故 排名 应 该 徘 前 。 

使 用 图 12-1 中 的 通过 网 页 候 虫 抓 取 的 结果 数据 库 文件 和 思考 题 12.6 计算 的 Rank 表 , 重 
新 开发 练习 题 12.4 中 的 搜索 引擎 ， 按 导入 链接 数 进行 网 页 排名 。 
>>> search2('links.db') 
Enter keyword: Paris 


URL RANK 

four.html 3 

two.html 2 

one.html 1 

Enter keyword.: 

UNIX 文本 搜索 工具 grep 带 两 个 参数 : 一 个 文本 文件 和 一 个 正则 表达 式 。 返 回 一 个 包含 匹配 


该 模式 的 字符 串 的 文本 行 的 列表 。 开 发 一 个 并 行 版 本 的 grep， 带 两 个 参数 : 来 自用 户 的 文本 
文件 和 正则 表达 式 ， 然 后 使 用 一 个 进程 池 来 搜索 文件 中 的 行 。 
我 们 使 用 程序 primedensity .py 比较 几 个 非常 大 的 整数 的 大 数值 范围 内 的 素数 的 密度 。 在 
这 个 问题 中 ， 你 将 比较 挛 生 素数 的 密度 。 挛 生 素 数 是 素数 对 ， 其 差 为 2。 最 开始 的 几 个 挛 生 素 
数 分 别 是 3 和 5、5 和 7、11 和 13、17 和 19、29 和 31。 编 写 一 个 应 用 程序 ， 使 用 计算 机 的 所 
有 内 核 ， 比 较 我 们 在 primedensity .py 中 使 用 的 相同 整数 范围 中 的 变 生 素数 个 数 。 
思考 题 10.26 要 求 读 者 开发 函数 anagram( ) ， 使 用 一 个 字典 ( 即 一 个 单词 列表 ) 来 计算 一 个 给 
定 字符 串 的 字 恋 (anagram)。 开 发 panagram( ) ， 该 图 数 的 一 个 并 行 版 本 ， 带 一 个 单词 列表 作 
为 输入 参数 ， 为 每 一 个 单词 计算 一 个 字谜 列表 。 
在 这 本 书 的 最 后 有 一 个 索引 ， 把 单词 映射 到 包含 该 单词 的 页 的 页 码 。 一 个 行 案 引 与 其 相似 : 它 
将 单词 映射 到 它们 出 现 的 文本 行 的 行 号 。 使 用 MapReduce 框架 开发 一 个 应 用 程序 ， 审 一 个 输 
和 参数: 一 个 文本 文件 名 ， 创 建 一 个 行 索 引 。 你 的 应 用 程序 应 该 将 索引 输出 到 一 个 文件 中 ， 以 
便 单 词 按 字 母 顺 序 出 现 ， 每 行 一 个 单词 。 每 个 单词 的 行 号 应 该 跟随 单词 之 后 ， 并 以 递增 的 顺序 
输出 。 
重新 实现 思考 题 12.16， 使 用 MapReduce 计算 每 个 网 页 的 导入 链接 的 数量 。 
Web 链接 图 是 一 组 相互 链接 的 网 页 的 超 链接 结构 的 描述 。 表 示 网 络 链接 图 的 一 个 方法 是 使 用 一 
个 (url，1linksList) 对 的 列表 ，(ur1L， LinksList) 对 应 于 一 个 网 页 ，url 表示 网 页 
的 URL，1linksList 是 包含 在 网 页 中 的 超 链 接 的 URL 列表 。 请 注意 ， 网 络 爬 虫 可 以 很 容易 
收集 此 信息 。 

反 向 Web 链接 图 是 一 组 相互 链接 的 网 页 的 超 链 接 结 构 的 男 一 种 描述 。 它 可 以 表示 为 
(url，incomingList) 对 列表 ，url 表示 一 个 网 页 的 URL，incomingList 表示 守信 起 
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链接 的 URL 列表 。 因 此 反问 Web 链接 图 明确 导入 链接 而 不 是 导出 链接 。 它 有 助 于 高 效 地 计算 
网 页 的 Google PageRank (网 页 排名 )。 

开发 一 个 因数 ， 带 一 个 Web 链接 图 作为 参数 (如 上 所 述 )， 返 回 反 回 Web 链接 图 。 
Web 服务 器 通常 会 为 其 处 理 的 每 个 HTTP 请 求 创建 一 个 日 志 ， 并 把 日 志 字 符 串 添加 到 一 个 日 
志文 件 。 保 存 日 志文 件 有 多 种 原因 。 一 个 特殊 的 原因 是 它 可 以 用 来 发 现 哪些 服务 硕 管 理 的 资源 
(由 URL 标识) 被 访问 ， 以 及 被 访问 的 频率 (表示 为 URL 访问 频率 )。 在 本 思考 题 中 ， 请 开发 
一 个 程序 ， 计 算 一 个 给 定 日 志文 件 中 的 URL 访问 频率 。 

Web 服务 需 日 志 条 目 是 以 一 种 众所周知 的 标准 格式 写 人 的 ， 这 种 格式 称 为 公共 日 志 格 式 。 
这 是 一 种 被 Apache httpd 服务 器 以 及 其 他 服务 器 所 采用 的 标准 格式 。 标 准 格式 使 开发 挖掘 访问 
日 志文 件 的 日 志 分 析 程 序 成 为 可 能 。 公 共 日 志 格 式 生 成 的 日 志文 件 条 目 如 下 所 示 : 


Qi = [16/Mar/2010:11:52:54 -0600] "GE] index.html HTTP/1.0" 200 1929 


这 条 日 志 包 含 很 多 信息 。 对 于 我 们 的 目的 而 言 ， 关 键 信息 是 请 求 的 资源 : index.html。 编 
写 一 个 程序 ， 计 算 日 志文 件 中 出 现 的 每 个 资源 的 访问 频率 ， 并 将 这 些 信息 写 入 数据 库 表 ， 表 的 
列 包 含 资源 URL 和 访问 频率 。 将 访问 频率 写 入 数据 库 使 URL 访问 频率 适合 于 查询 和 分 析 。 
使 用 MapReduce 编写 一 个 应 用 程序 ， 计 算 一 组 小 说 的 词语 索引 。 词 语 索 引 是 一 种 映射 关系 ， 
把 一 组 单词 中 的 每 个 单词 映射 到 小 说 中 包含 该 单词 的 句子 的 列表 。 应 用 程序 的 输入 是 包含 小 说 
的 文本 文件 集合 和 要 映射 的 单词 集合 。 要 求 将 词语 索引 输出 到 一 个 文件 中 。 
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本 书 由 经 典 畅 销 书籍 《 Java 核心 技术 》 的 作者 Cay Horstmann 撰 写 ， 非 常 适合 
Python 初学 者 和 爱好 者 阅读 ， 不 仅 能 够 帮助 新 手 快 速 入 门 ， 掌 握 基础 知识 ， 更 有 益 于 培 
养 解决 实际 问题 的 思维 和 能 力 。 书 中 将 解决 方案 分 解 为 详尽 的 步骤 ， 循 序 渐进 地 引导 读者 
利用 学 到 的 概念 解决 有 趣 的 问题 。 从 算法 设计 到 流程 图 、 测 试用 例 、 逐 步 提炼 、 修 改 笑 法 
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多 年 的 发 展 和 完善 ， 形 成 了 独到 的 跨 学 科 方 法 ， 并 配 有 丰富 的 教 辅 资源 。 本 书 适 
ante 特别 关注 编程 在 科学 和 工程 中 的 应 用 ， 涵盖 材料 科学 、 基 因 组 学 、 
物理 和 网 络 系统 等 不 同 领域 的 实例 ， 在 讲授 编程 方法 的 同时 注重 培养 计算 思维 ， 为 专业 领 
域 的 深入 学 习 葛 定 基础 。 
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计算 机 科学 导论 ( 原 书 第 3 版 ) 
作者 : [ 美 ] 贝 赫 鲁 兹 A. 佛 罗 赞 译 者 : 刘 艺 刘 哲 雨 等 I SBN: 978-7-111-51163-2 定价 ， 69.00 元 


“这 是 一 本 条 理 清晰 并 且 深 入 浅 出 的 教科 书 ， 这 部 教科 书包 含 传统 和 现代 计算 机 的 基本 原理 。” 
一 一 SQm Ssemugabi, 南非 大 学 计算 机 学 院 资深 讲师 

《计算 机 科学 导论 》 是 国外 计算 机 等 [相关 专业 本 科 生 的 一 本 基础 课 教 材 ， 也 是 一 本 非常 经 典 的 计算 机 入 门 读 物 。 
作为 一 本 百科 全 书 式 的 计算 机 专业 基础 入 门 读 物 ， 书 中 涉及 计算 机 科学 的 方方面面 。 虽 然 读 者 对 象 是 计算 机 专业 的 学 
生 ， 但 这 本 书 深 入 浅 出 ， 引 人 入 胜 ， 匀 画 出 计算 机 科学 体系 的 框架 ， 为 有 志 于 IT 行业 的 学 生 葛 定 计算 机 科学 知识 的 基 
础 ， 架 设 进一步 深入 专业 理论 学 习 的 桥梁 。 

本 书 是 基于 美国 计算 机 学 会 (ACM) 推荐 的 C30 课 程 设计 的 ， 从 广度 上 覆盖 了 计算 机 科学 所 有 的 领域 ， 既 适合 国 
内 大 专 院 校 用 作 计 算 机 基础 课 教材 ， 也 可 以 供 有 意 在 计算 机 方面 发 展 的 非 计 算 机 专业 读者 作为 入 门 参考 。 


计算 机 科学 概论 ( 原 书 第 5 版 ) 
作者 : [ 美 ] 内 尔 ， 和 化 尔 约翰 。 路 易 斯 
中 文 版 书号 : 978-7-111-53425-9， 定 价 ; 79.00 英文 版 书号 ,， 978-7-111-44813-6， 定 价 ; 69.00 


本 书 由 当今 该 领域 备 受 赞誉 且 经 验 丰 富 的 教育 家 Nell Dale 和 John Lewis 共 同 编写 ， 全 面 介绍 计算 机 科学 领域 的 基 
础 知识 ， 为 广大 学 生 勾勒 了 一 幅 生动 的 画卷 。 就 整体 而 言 ， 全 书 内 容 翔实 、 覆 盖 面 广 ， 旨 在 向 读者 展示 计算 机 科学 的 全 
貌 ， 从 细节 上 看 ， 本 书 层次 清晰 、 描 述 生 动 ， 基 于 计算 机 系统 的 洋葱 式 结构 ， 分 别 介绍 信息 层 、 硬 件 层 、 程 序 设计 层 、 
操作 系统 层 、 应 用 程序 层 和 通信 层 ， 涉 及 计算 机 科学 的 各 个 层面 。 

本 书 贯穿 了 计算 机 系统 的 各 个 方面 ， 非 常 适合 作为 计算 机 专业 的 计算 机 导论 课程 教材 ， 为 后 续 专业 课程 打下 坚实 
的 基础 ; 同时 还 适合 作为 非 计算 机 专业 的 计算 机 总 论 课程 教材 ， 提 供 计 算 机 系统 全 面 完整 的 介绍 。 
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本 书 的 编写 风格 非常 清晰 ， 章 节 的 划分 合理 实用 。 书 中 包含 的 技术 信息 对 于 那些 已 经 初步 了 解 基 本 计算 机 概念 的 
学 生 既 轻松 有 趣 又 非常 实用 。 
一 一 Martha Lindberg， 明 尼 苏 达州 立 大 学 
本 书 采用 最 先进 的 方法 和 技术 讲述 计算 机 基础 知识 ， 涉 及 面 之 广 、 内 容 之 丰富 、 方 法 之 独特 ， 令 人 叹为观止 堪 
称 计算 机 基础 知识 的 百科 全 书 。 本 书 涵盖 影响 计算 和 日 常生 活 的 重要 技术 趋势 ， 对 数据 安全 、 个 人 隐私 、 在 线 安 全 、 数 
字 版 权 管理 、 开 源 软件 和 便携 式 应 用 程序 等 进行 了 广泛 讨论 。 全 书 层 次 合理 、 图 文 并 茂 ， 各 章 还 配 有 测验 ， 非 常 适 合作 
为 高 校 各 专业 的 计算 机 导论 教材 和 教师 参考 书 ， 也 可 供 广 大 计算 机 爱好 者 参考 使 用 。 
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本 书 是 美国 德 保 罗 大 学 的 精品 课程 教材 一 它 与 传统 程序 设计 书籍 最 大 的 不 同 在 于 ,不 仅 讲 授 编 程 知识 ,一 而 且 
重视 计算 思维 的 培养 。 此 外 还 涵盖 了 丰富 的 计算 机 科学 主题 以 及 当前 的 热门 技术 ， 有 助 于 学 生 全 面 了 解 不 同 的 计 
算 领 域 ， 并 掌握 开发 与 Web 和 数据 库 交 互 的 现代 应 用 程序 的 能 力 。 


主要 特点 
@ 从 Python 开始 学 习 计算 机 科学 。 专 为 第 一 门 程序 设计 课程 而 编写 ， 充 分 利用 Python 语言 的 易学 性 和 易 用 
性 ， 搭 建 了 平缓 的 学 习 曲 线 ， 同 时 使 用 Python 库 开 展 多 领域 的 计算 机 科学 研究 ， 并 将 重点 聚焦 于 现代 应 用 
程序 开发 上 。 


@ “广度 优先 ”的 内 容 组 织 方 式 。 以 计算 机 科学 导论 开篇 ， i 算法 设计 “问题 求解 
和 应 用 程序 开发 ， 最 后 介绍 高 级 应 用 。 精 心 设计 篇 章 布局 ， 在 最 合适 的 时 刻 引 入 最 有 效 的 工具 ， 而 非 堆 大 

@ 人 免费 的 代码 和 丰富 的 实践 案例 。 学 生 通 过 编程 实践 可 快速 发 现 问 题 并 提升 解决 能 力 ， 案 例 包 括 Web 有 爬虫 、 
搜索 引擎 和 数据 挖掘 等 主题 ， 涉 及 递归 、 深 度 优先 搜索 、MapReduce 框 架 、 图 形 用 户 界 面 、HTML 解 析 器 
等 概念 和 工具 。 
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